[發(fā)明專利]一種多機(jī)器人協(xié)同的3D聲源識(shí)別定位方法有效
| 申請(qǐng)?zhí)枺?/td> | 202011354622.6 | 申請(qǐng)日: | 2020-11-27 |
| 公開(公告)號(hào): | CN112379330B | 公開(公告)日: | 2023-03-10 |
| 發(fā)明(設(shè)計(jì))人: | 安康;付衛(wèi)婷 | 申請(qǐng)(專利權(quán))人: | 浙江同善人工智能技術(shù)有限公司 |
| 主分類號(hào): | G01S5/22 | 分類號(hào): | G01S5/22 |
| 代理公司: | 上海伯瑞杰知識(shí)產(chǎn)權(quán)代理有限公司 31227 | 代理人: | 周兵 |
| 地址: | 314100 浙江省嘉*** | 國(guó)省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 機(jī)器人 協(xié)同 聲源 識(shí)別 定位 方法 | ||
本發(fā)明公開了一種多機(jī)器人協(xié)同的3D聲源識(shí)別定位方法,其包括以下步驟:(S1)采集各機(jī)器人的麥克風(fēng)的音頻信號(hào);(S2)將各音頻信號(hào)與參考音頻信號(hào)做互相關(guān)計(jì)算,若計(jì)算結(jié)果達(dá)到設(shè)定的閾值,則將其識(shí)別為待識(shí)別的音頻信號(hào);(S3)對(duì)于每個(gè)機(jī)器人,計(jì)算該機(jī)器人上任意兩個(gè)麥克風(fēng)的音頻信號(hào)之間的互相關(guān)函數(shù),然后對(duì)方向空間做離散化,在每個(gè)方向上計(jì)算對(duì)應(yīng)時(shí)延下的互相關(guān)函數(shù)之和,找出最大響應(yīng)值,最大響應(yīng)值對(duì)應(yīng)的方向即是聲源相對(duì)該機(jī)器人的方向(S4)求解聲源的坐標(biāo),并根據(jù)聲源方向以及各機(jī)器人所在的位置對(duì)聲源的坐標(biāo)進(jìn)行修正。本發(fā)明相較于通過到達(dá)時(shí)間差來(lái)計(jì)算空間聲源的位置,提出了基于離散空間搜索最大相關(guān)性函數(shù)值的方法,其抵抗混響能力更強(qiáng),搜索代價(jià)更小,運(yùn)行速度快。
技術(shù)領(lǐng)域
本發(fā)明涉及移動(dòng)機(jī)器人領(lǐng)域,特別涉及一種多機(jī)器人協(xié)同的3D聲源識(shí)別定位方法。
背景技術(shù)
聲源定位是聽覺系統(tǒng)對(duì)發(fā)聲物體位置的判斷過程,它包括水平聲源定位和垂直聲源定位以及與聽者距離的識(shí)別。對(duì)聲源方位的識(shí)別是人和動(dòng)物對(duì)環(huán)境感知的一種基本方法,有利于動(dòng)物捕捉獵物、尋找配偶和躲避危險(xiǎn)。在多聲源的復(fù)雜聲場(chǎng)中,聲源定位功能更有助于從背景聲中鎖定聲學(xué)目標(biāo),分離有用信息。
聲源的識(shí)別與定位技術(shù)在機(jī)器人的目標(biāo)定位領(lǐng)域有很重要的應(yīng)用。借助聽覺來(lái)辨別聲源并判定發(fā)聲的位置,使得機(jī)器人在感知環(huán)境時(shí)能獲取更多的信息。一個(gè)典型的應(yīng)用場(chǎng)景是,在RoboCup足球比賽中,機(jī)器人需要辨別裁判吹的哨聲并定位該哨聲以開始比賽。正確識(shí)別哨聲便能搶占先機(jī),能否正確的辨別哨聲對(duì)比賽也起著非常重要的作用。
一般聲源識(shí)別的方法主要采用提取信號(hào)頻率主成分的方法,判斷其是否在該類聲音的頻率范圍內(nèi),但往往由于搭載在仿人機(jī)器人上的麥克風(fēng)采樣頻率較低等原因,很容易受到高頻噪聲的干擾而產(chǎn)生誤識(shí)別。另外,一般用來(lái)聲源定位的方法使用GCC-PHAT算法,根據(jù)聲源的到達(dá)時(shí)間差(TDOA)來(lái)建立空間幾何關(guān)系,計(jì)算出聲源的方向,但這種方法也很容易受到混響的干擾。
發(fā)明內(nèi)容
本發(fā)明的目的是根據(jù)上述現(xiàn)有技術(shù)的不足,提供了一種多機(jī)器人協(xié)同的3D聲源識(shí)別定位方法。
本發(fā)明目的實(shí)現(xiàn)由以下技術(shù)方案完成:
一種多機(jī)器人協(xié)同的3D聲源識(shí)別定位方法,其特征在于包括以下步驟:
(S1)采集各機(jī)器人的麥克風(fēng)的音頻信號(hào),并對(duì)其做快速傅里葉變換,得到各音頻信號(hào)的頻域信號(hào);
(S2)將各音頻信號(hào)與參考音頻信號(hào)做互相關(guān)計(jì)算,若計(jì)算結(jié)果達(dá)到設(shè)定的閾值,則將其識(shí)別為待識(shí)別的音頻信號(hào),并跳轉(zhuǎn)至步驟(S3);否則跳轉(zhuǎn)至步驟(S1);
(S3)對(duì)于每個(gè)機(jī)器人,計(jì)算該機(jī)器人上任意兩個(gè)麥克風(fēng)的音頻信號(hào)之間的互相關(guān)函數(shù),然后對(duì)方向空間做離散化,在每個(gè)方向上計(jì)算對(duì)應(yīng)時(shí)延下的互相關(guān)函數(shù)之和,找出最大響應(yīng)值,最大響應(yīng)值對(duì)應(yīng)的方向即是聲源相對(duì)該機(jī)器人的方向
(S4)求解聲源的坐標(biāo),并根據(jù)聲源方向以及各機(jī)器人所在的位置對(duì)聲源的坐標(biāo)進(jìn)行修正。
本發(fā)明的進(jìn)一步改進(jìn)在于,在步驟(S1)中,采集音頻信號(hào)的過程中,采樣頻率大于參考音頻信號(hào)的頻率的兩倍。
本發(fā)明的進(jìn)一步改進(jìn)在于,在步驟(S2)中,當(dāng)至少兩個(gè)所述機(jī)器人采集到的音頻信號(hào)的頻域信號(hào)達(dá)到設(shè)定閾值時(shí),將采集到的音頻信號(hào)識(shí)別為待識(shí)別的音頻信號(hào)。
本發(fā)明的進(jìn)一步改進(jìn)在于,在步驟(S2)中,將某個(gè)音頻信號(hào)為xi(n)與參考音頻信號(hào)xref(n)做互相關(guān)計(jì)算包括以下步驟
(S21)計(jì)算參考音頻信號(hào)xref(n)的自相關(guān)函數(shù)Rref(τ)以及自相關(guān)函數(shù)Rref(τ)的峰值,計(jì)算公式為:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于浙江同善人工智能技術(shù)有限公司,未經(jīng)浙江同善人工智能技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011354622.6/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G01S 無(wú)線電定向;無(wú)線電導(dǎo)航;采用無(wú)線電波測(cè)距或測(cè)速;采用無(wú)線電波的反射或再輻射的定位或存在檢測(cè);采用其他波的類似裝置
G01S5-00 通過確定兩個(gè)或更多個(gè)方向或位置線的配合來(lái)定位;通過確定兩個(gè)或更多個(gè)距離的配合進(jìn)行定位
G01S5-02 .利用無(wú)線電波
G01S5-16 .應(yīng)用了除無(wú)線電波外的其他電磁波
G01S5-18 .應(yīng)用了超聲波、聲波或次聲波
G01S5-20 ..由多個(gè)分隔開的定向器確定的信號(hào)源位置
G01S5-22 ..用多條由路徑差測(cè)量確定的位置線的配合確定信號(hào)源的位置
- 移動(dòng)通信終端的協(xié)同方法及其界面系統(tǒng)
- 業(yè)務(wù)協(xié)同流程配置、業(yè)務(wù)協(xié)同方法及裝置
- 一種基于健康檔案共享平臺(tái)的跨醫(yī)院協(xié)同檢查信息系統(tǒng)
- 一種協(xié)同控制方法、協(xié)同控制系統(tǒng)及變頻器
- 基于協(xié)同網(wǎng)關(guān)的跨域協(xié)同交互方法
- 一種生產(chǎn)協(xié)同管理方法及系統(tǒng)
- 云邊協(xié)同方法、裝置、系統(tǒng)、設(shè)備和介質(zhì)
- 一種智能辦公協(xié)同操作方法及系統(tǒng)
- 一種用于無(wú)人裝備的時(shí)間協(xié)同航跡規(guī)劃方法
- 基于大數(shù)據(jù)的智慧辦公協(xié)同方法及系統(tǒng)
- 音頻信號(hào)接收裝置、音頻信號(hào)接收方法和音頻信號(hào)傳輸系統(tǒng)
- 聲源定位方法和裝置
- 聲源分離裝置和方法以及程序
- 改進(jìn)的頻域SRP聲源方位估計(jì)方法
- 用于提供聲源信息的方法和裝置及增強(qiáng)現(xiàn)實(shí)眼鏡
- 語(yǔ)音識(shí)別方法、裝置、服務(wù)器及存儲(chǔ)介質(zhì)
- 一種聲源定位方法、裝置、介質(zhì)和設(shè)備
- 一種軌道車輛車內(nèi)噪聲源識(shí)別方法及系統(tǒng)
- 一種目標(biāo)定位方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 聲音編碼裝置、聲音譯碼裝置及聲音編碼譯碼裝置、以及聲音編碼方法、聲音譯碼方法及聲音編碼譯碼方法
- 識(shí)別媒體、識(shí)別媒體的識(shí)別方法、識(shí)別對(duì)象物品以及識(shí)別裝置
- 一種探針卡識(shí)別裝置和方法
- 識(shí)別裝置、識(shí)別方法以及記錄介質(zhì)
- 識(shí)別裝置、識(shí)別系統(tǒng),識(shí)別方法以及存儲(chǔ)介質(zhì)
- 識(shí)別程序、識(shí)別方法以及識(shí)別裝置
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 識(shí)別裝置、識(shí)別方法以及識(shí)別程序
- 識(shí)別裝置、識(shí)別方法及識(shí)別程序





