[發(fā)明專(zhuān)利]基于深度學(xué)習(xí)的麥克風(fēng)陣列聲源定位方法及聲源識(shí)別方法在審
| 申請(qǐng)?zhí)枺?/td> | 202110465688.0 | 申請(qǐng)日: | 2021-04-28 |
| 公開(kāi)(公告)號(hào): | CN113514801A | 公開(kāi)(公告)日: | 2021-10-19 |
| 發(fā)明(設(shè)計(jì))人: | 陳思應(yīng) | 申請(qǐng)(專(zhuān)利權(quán))人: | 成都啟英泰倫科技有限公司 |
| 主分類(lèi)號(hào): | G01S5/22 | 分類(lèi)號(hào): | G01S5/22;G06N3/04;G06N3/08 |
| 代理公司: | 暫無(wú)信息 | 代理人: | 暫無(wú)信息 |
| 地址: | 610041 四川省成都市高*** | 國(guó)省代碼: | 四川;51 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 深度 學(xué)習(xí) 麥克風(fēng) 陣列 聲源 定位 方法 識(shí)別 | ||
1.基于深度學(xué)習(xí)的麥克風(fēng)陣列聲源定位方法,其特征在于:包括如下步驟:
S1. 設(shè)置麥克風(fēng)陣列,所述麥克風(fēng)陣列包括三個(gè)以上的麥克風(fēng);
S2. 對(duì)麥克風(fēng)進(jìn)行兩兩分組,利用每一組麥克風(fēng)進(jìn)行聲源位置定位,具體為:
S21. 以?xún)蓚€(gè)麥克風(fēng)連線為X軸,連線中點(diǎn)為坐標(biāo)原點(diǎn)構(gòu)建三維坐標(biāo)系;利用下式計(jì)算聲源相對(duì)坐標(biāo)原點(diǎn)的方位角θ;
其中c為聲速,mi1 、mi2表示兩個(gè)麥克風(fēng)在坐標(biāo)系中的位置,τi為兩個(gè)麥克風(fēng)接收到聲音信號(hào)的延時(shí)差;
S22. 對(duì)兩個(gè)麥克風(fēng),求得麥克風(fēng)接收到的頻域信號(hào)Xi(k,l);其中,下標(biāo)i表示不同的麥克風(fēng),k表示第k個(gè)頻點(diǎn),l表示第l幀語(yǔ)音信號(hào);
S3. 遍歷各組麥克風(fēng)求得各組麥克風(fēng)對(duì)應(yīng)的方位角θ和頻域信號(hào)后,再進(jìn)行以下處理:
將空間全方位角[-180°, 180°]均分為Q等份,定義每一個(gè)空間角索引i = 1,2,...,Q;則第i個(gè)空間角的波束S(i)為:
(4)
其中:為第k個(gè)頻點(diǎn)的相位角,F(xiàn)s為頻域信號(hào)的采樣率,τi為延時(shí)差,θ為空間劃分的方位角,c為聲音傳播速度,*表示取復(fù)共軛,Xm1(k,l)、Xm2(k,l)分別表示同一組內(nèi)兩個(gè)麥克風(fēng)的頻域信號(hào),M為麥克風(fēng)陣列的麥克風(fēng)數(shù)量,K表示頻域信號(hào)的頻點(diǎn)總數(shù),j表示虛部,exp表示求自然對(duì)數(shù);
遍歷空間全部空間角,得到空間波束向量Seng:
選取空間波束向量中峰值最大的位置所對(duì)應(yīng)的空間角即為所求聲源方向。
2.聲源識(shí)別方法,其特征在于,包括如下步驟:
S11. 設(shè)置包括2個(gè)以上麥克風(fēng)的麥克風(fēng)陣列,放置在能接收到聲源音頻信息的位置;
S12. 麥克風(fēng)陣列的各個(gè)麥克風(fēng)收到語(yǔ)音后,根據(jù)麥克風(fēng)陣列聲源定位方法,獲取到聲源在空間的方位角,進(jìn)而得到聲源的位置;
S13. 根據(jù)步驟S12得到的聲源位置對(duì)該聲源位置發(fā)出的目標(biāo)音頻信號(hào)進(jìn)行增強(qiáng),其他位置發(fā)出的非目標(biāo)音頻信號(hào)進(jìn)行抑制;對(duì)音頻信號(hào)提取特征信息后輸入神經(jīng)網(wǎng)絡(luò)進(jìn)行運(yùn)算,對(duì)運(yùn)算結(jié)果解碼后得到語(yǔ)音內(nèi)容。
3.根據(jù)權(quán)利要求2所述的聲源識(shí)別方法,其特征在于:所述神經(jīng)網(wǎng)絡(luò)為深度神經(jīng)網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)中任意一種。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于成都啟英泰倫科技有限公司,未經(jīng)成都啟英泰倫科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110465688.0/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G01S 無(wú)線電定向;無(wú)線電導(dǎo)航;采用無(wú)線電波測(cè)距或測(cè)速;采用無(wú)線電波的反射或再輻射的定位或存在檢測(cè);采用其他波的類(lèi)似裝置
G01S5-00 通過(guò)確定兩個(gè)或更多個(gè)方向或位置線的配合來(lái)定位;通過(guò)確定兩個(gè)或更多個(gè)距離的配合進(jìn)行定位
G01S5-02 .利用無(wú)線電波
G01S5-16 .應(yīng)用了除無(wú)線電波外的其他電磁波
G01S5-18 .應(yīng)用了超聲波、聲波或次聲波
G01S5-20 ..由多個(gè)分隔開(kāi)的定向器確定的信號(hào)源位置
G01S5-22 ..用多條由路徑差測(cè)量確定的位置線的配合確定信號(hào)源的位置
- 根據(jù)用戶(hù)學(xué)習(xí)效果動(dòng)態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個(gè)人化學(xué)習(xí)服務(wù)的方法
- 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)移動(dòng)學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 游戲?qū)W習(xí)效果評(píng)測(cè)方法及系統(tǒng)





