[發(fā)明專利]一種利用傳聲器陣列的語音聲源定位方法有效
| 申請?zhí)枺?/td> | 201911069273.0 | 申請日: | 2019-11-05 |
| 公開(公告)號(hào): | CN110838303B | 公開(公告)日: | 2022-02-08 |
| 發(fā)明(設(shè)計(jì))人: | 王浩;盧晶 | 申請(專利權(quán))人: | 南京大學(xué) |
| 主分類號(hào): | G10L25/30 | 分類號(hào): | G10L25/30;G10L25/51;G01S5/18 |
| 代理公司: | 江蘇法德東恒律師事務(wù)所 32305 | 代理人: | 李媛媛 |
| 地址: | 210046 江蘇*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 利用 傳聲器 陣列 語音 聲源 定位 方法 | ||
1.一種利用傳聲器陣列的語音聲源定位方法,其特征在于,包括以下步驟:
步驟1,利用傳聲器陣列采集語音信號(hào)和干擾信號(hào),獲得含噪語音信號(hào)和干凈語音信號(hào)的時(shí)-頻域信號(hào),并計(jì)算含噪語音信號(hào)和干凈語音信號(hào)的功率譜幅度對數(shù)值;所述干凈語音信號(hào)為僅由語音直達(dá)聲構(gòu)成的信號(hào);
步驟2,對含噪語音信號(hào)和干凈語音信號(hào)時(shí)-頻域中所有的時(shí)-頻點(diǎn),分別計(jì)算各自的空間功率響應(yīng)譜,并進(jìn)一步估計(jì)時(shí)-頻點(diǎn)對應(yīng)的時(shí)延,記和分別是含噪語音信號(hào)和干凈語音信號(hào)對應(yīng)于時(shí)間n和頻帶k的時(shí)-頻窗時(shí)延估計(jì)值;獲得語音直達(dá)聲對應(yīng)的時(shí)-頻點(diǎn)分布圖;
步驟3,利用步驟1的含噪語音信號(hào)和干凈語音信號(hào)的功率譜幅度對數(shù)值和步驟2的語音直達(dá)聲對應(yīng)的時(shí)-頻點(diǎn)分布圖訓(xùn)練UNET結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò);利用待測信號(hào)的功率譜幅度對數(shù)值和已訓(xùn)練的神經(jīng)網(wǎng)絡(luò)估計(jì)待測信號(hào)的語音直達(dá)聲對應(yīng)的時(shí)-頻點(diǎn)分布圖;
步驟4,利用步驟3估計(jì)的語音直達(dá)聲分布作為權(quán)重,結(jié)合加權(quán)定位算法得到語音聲源定位結(jié)果。
2.根據(jù)權(quán)利要求1所述的一種利用傳聲器陣列的語音聲源定位方法,其特征在于,所述步驟2中,選取直達(dá)聲對應(yīng)的時(shí)-頻分布點(diǎn)需同時(shí)滿足以下條件:
1)在含噪語音信號(hào)中,時(shí)延估計(jì)值與真實(shí)時(shí)延τ=(dsinθ)/c相差小于閾值TH1的時(shí)-頻窗,d、c、θ分別是傳聲器間距、聲速、語音源到達(dá)陣列的角度;
2)在干凈語音信號(hào)中,時(shí)延估計(jì)值與真實(shí)時(shí)延τ相差小于閾值TH1的時(shí)-頻窗;
3)含噪語音信號(hào)和干凈語音信號(hào)相同位置空間功率譜響應(yīng)相關(guān)性大于閾值TH2的時(shí)-頻窗。
3.根據(jù)權(quán)利要求1所述的一種利用傳聲器陣列的語音聲源定位方法,其特征在于,所述步驟3中,神經(jīng)網(wǎng)絡(luò)的輸入為含噪語音信號(hào)的對數(shù)化功率譜圖,輸出為干凈語音信號(hào)對數(shù)化功率譜圖和語音直達(dá)聲時(shí)-頻點(diǎn)分布圖,其中,干凈語音信號(hào)對數(shù)化功率譜圖為輔助訓(xùn)練,語音直達(dá)聲時(shí)-頻點(diǎn)分布圖對應(yīng)的值作為步驟4的時(shí)-頻點(diǎn)的權(quán)重值。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于南京大學(xué),未經(jīng)南京大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911069273.0/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





