[發(fā)明專利]聲源定向方法和裝置及存儲介質(zhì)有效
| 申請?zhí)枺?/td> | 202010617711.9 | 申請日: | 2020-06-30 |
| 公開(公告)號: | CN111880146B | 公開(公告)日: | 2023-08-18 |
| 發(fā)明(設(shè)計)人: | 馬路;趙培;蘇騰榮 | 申請(專利權(quán))人: | 海爾優(yōu)家智能科技(北京)有限公司 |
| 主分類號: | G01S5/20 | 分類號: | G01S5/20 |
| 代理公司: | 北京康信知識產(chǎn)權(quán)代理有限責(zé)任公司 11240 | 代理人: | 周婷婷 |
| 地址: | 100086 北京市海淀區(qū)知春*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 聲源 定向 方法 裝置 存儲 介質(zhì) | ||
本發(fā)明公開了一種聲源定向方法和裝置及存儲介質(zhì)。其中,該方法包括:確定待定向的目標(biāo)聲源;根據(jù)麥克風(fēng)陣列的結(jié)構(gòu)信息及目標(biāo)聲源到達麥克風(fēng)陣列中各個麥克風(fēng)的時延,確定目標(biāo)聲源的第一方向矢量集合;依次提取第一方向矢量集合中每個導(dǎo)引方向矢量上的聲音信號信息,以生成與每個導(dǎo)引方向矢量分別對應(yīng)的第一語譜圖集合;根據(jù)第一語譜圖集合中的特征參數(shù)信息計算出導(dǎo)引方向矢量上的聲音信號的特征參數(shù);根據(jù)特征參數(shù)利用分類器從第一方向矢量集合中確定出目標(biāo)導(dǎo)引方向矢量。本發(fā)明解決了聲源的定向精度較差的技術(shù)問題。
技術(shù)領(lǐng)域
本發(fā)明涉及計算機領(lǐng)域,具體而言,涉及一種聲源定向方法和裝置及存儲介質(zhì)。
背景技術(shù)
聲源定向技術(shù)是當(dāng)今人機交互領(lǐng)域的一項關(guān)鍵技術(shù),目前聲源定向技術(shù)主要是基于到達時間差(Time?Delay?Of?Arrival,TDOA)的定位方法。具體的,基于TDOA的定位算法是一種雙步定位算法,它首先估計聲源到達不同麥克風(fēng)的時間差,再利用得到的時延,結(jié)合麥克風(fēng)陣列的結(jié)構(gòu),確定聲源的位置。
但基于TDOA的定位算法是直接計算不同頻點麥克風(fēng)之間的相位差,由于采樣率大小和麥克風(fēng)間距受限于物理硬件,進而導(dǎo)致計算得到的相位差很小,換言之基于TDOA的定位算法對于聲源定向精度的提高局限性較高;與此同時,由于環(huán)境噪聲和干擾等影響,相位差這一特征很容易受到影響,也會影響定向精度。
即,相關(guān)技術(shù)中存在聲源的定向精度較差的問題。
針對上述的問題,目前尚未提出有效的解決方案。
發(fā)明內(nèi)容
本發(fā)明實施例提供了一種聲源定向方法和裝置及存儲介質(zhì),以至少解決聲源的定向精度較差的技術(shù)問題。
根據(jù)本發(fā)明實施例的一個方面,提供了一種聲源定向方法,包括:確定待定向的目標(biāo)聲源;根據(jù)麥克風(fēng)陣列的結(jié)構(gòu)信息及上述目標(biāo)聲源到達上述麥克風(fēng)陣列中各個麥克風(fēng)的時延,確定上述目標(biāo)聲源的第一方向矢量集合,其中,上述第一方向矢量集合中包括的每個導(dǎo)引方向矢量用于指示上述目標(biāo)聲源到對應(yīng)麥克風(fēng)的方向;依次提取上述第一方向矢量集合中每個導(dǎo)引方向矢量上的聲音信號信息,以生成與每個導(dǎo)引方向矢量分別對應(yīng)的第一語譜圖集合,其中,上述第一語譜圖集合中記錄有上述導(dǎo)引方向矢量上的聲音信號的特征參數(shù)信息;根據(jù)上述第一語譜圖集合中的特征參數(shù)信息計算出上述導(dǎo)引方向矢量上的聲音信號的特征參數(shù);根據(jù)特征參數(shù)利用分類器從上述第一方向矢量集合中確定出目標(biāo)導(dǎo)引方向矢量,其中,上述目標(biāo)導(dǎo)引方向矢量用于指示上述目標(biāo)聲源的方向。
根據(jù)本發(fā)明實施例的另一方面,還提供了一種聲源定向裝置,包括:第一確定單元,用于確定待定向的目標(biāo)聲源;第二確定單元,用于根據(jù)麥克風(fēng)陣列的結(jié)構(gòu)信息及上述目標(biāo)聲源到達上述麥克風(fēng)陣列中各個麥克風(fēng)的時延,確定上述目標(biāo)聲源的第一方向矢量集合,其中,上述第一方向矢量集合中包括的每個導(dǎo)引方向矢量用于指示上述目標(biāo)聲源到對應(yīng)麥克風(fēng)的方向;生成單元,用于依次提取上述第一方向矢量集合中每個導(dǎo)引方向矢量上的聲音信號信息,以生成與每個導(dǎo)引方向矢量分別對應(yīng)的第一語譜圖集合,其中,上述第一語譜圖集合中記錄有上述導(dǎo)引方向矢量上的聲音信號的特征參數(shù)信息;計算單元,用于根據(jù)上述第一語譜圖集合中的特征參數(shù)信息計算出上述導(dǎo)引方向矢量上的聲音信號的特征參數(shù);第三確定單元,用于根據(jù)特征參數(shù)利用分類器從上述第一方向矢量集合中確定出目標(biāo)導(dǎo)引方向矢量,其中,上述目標(biāo)導(dǎo)引方向矢量用于指示上述目標(biāo)聲源的方向。
根據(jù)本發(fā)明實施例的又一方面,還提供了一種計算機可讀的存儲介質(zhì),該計算機可讀的存儲介質(zhì)中存儲有計算機程序,其中,該計算機程序被設(shè)置為運行時執(zhí)行上述聲源定向方法。
根據(jù)本發(fā)明實施例的又一方面,還提供了一種電子裝置,包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,其中,上述處理器通過計算機程序執(zhí)行上述的聲源定向方法。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于海爾優(yōu)家智能科技(北京)有限公司,未經(jīng)海爾優(yōu)家智能科技(北京)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010617711.9/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





