[發明專利]音源定向方法及裝置和計算機可讀存儲介質有效
| 申請號: | 201910117064.2 | 申請日: | 2019-02-15 |
| 公開(公告)號: | CN109831731B | 公開(公告)日: | 2020-08-04 |
| 發明(設計)人: | 高威特;葉振昀;張楠賡 | 申請(專利權)人: | 杭州嘉楠耘智信息科技有限公司 |
| 主分類號: | H04R19/04 | 分類號: | H04R19/04 |
| 代理公司: | 北京市中倫律師事務所 11410 | 代理人: | 楊黎峰;鐘錦舜 |
| 地址: | 310000 浙江省杭州市*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 音源 定向 方法 裝置 計算機 可讀 存儲 介質 | ||
提供一種音源定向方法,包括:獲取多個聲音輸入信號;在多個預設方向中的每個預設方向上計算多個聲音輸入信號的累加聲音信號,并為每個累加聲音信號設置定向判斷參數,用于判斷累加聲音信號對應的預設方向是否為聲音輸入信號的音源方向;計算每個預設方向上的累加聲音信號的強度特征值;比較各累加聲音信號的強度特征值的大小,根據比較結果更新各累加聲音信號的定向判斷參數的值;根據各累加聲音信號的定向判斷參數的值判斷各累加聲音信號之一對應的預設方向為聲音輸入信號的音源方向。在該方法中,定向判斷參數帶有累加聲音信號的歷史強度信息,避免僅根據聲音信號的當前強度進行音源方向判斷。還提供相應的音源定向裝置及計算機可讀存儲介質。
技術領域
本發明屬于音源定向領域,具體涉及一種音源定向方法及裝置以及計算機可讀存儲介質,用于確定目標聲音的音源方向,例如用于確定人聲的音源方向。
背景技術
當前的聲音定向系統大多基于麥克風陣列來完成音源定向。麥克風陣列是麥克風的集群,包括多個麥克風,可以用于對空間中的聲音進行采樣和處理,以確定該空間中音源相對于方向特性進行采樣和處理。麥克風陣列中通常采用“延時后求和”(delay-and-sum)技術對各麥克風采集的聲音信號進行處理。即針對每一個預設音源方向,相對于麥克風陣列中的參考麥克風,將每個麥克風收到的聲音信號按照該麥克風在該預設音源方向上相對于參考麥克風的聲音傳播延時值進行聲音信號延時處理,再將各個預設方向上經過延時處理的聲音信號以及參考麥克風接收的聲音信號進行疊加以獲得該預設音源方向上的累加聲音信號,接著在得到的這些累加聲音信號中找出具有最大振幅的累加聲音信號,將該具有最大振幅的累加聲音信號所對應的預設方向判斷為音源方向。
現有技術中的音源定向通常包括如下兩種技術方案:第一種確定音源方向的方案是搜索空間以查找最大能量區域,該方案通常對諸如噪聲和混響之類的干擾不具有魯棒性;第二種確定音源方向的方案是確定聲音信號到達不同麥克風的時間差,即,由于麥克風陣列中不同麥克風的位置不同,來自音源的同一聲波通常以不同時間到達這些麥克風。
音源定向的一個常見應用場景是確定人聲聲源的方向。例如在視頻會議的過程中,需要確定當前發言者的方位。對此,通常是在多個方向上計算出麥克風陣列采集的多路聲音信號在各方向上的累加聲音強度,然后將最大聲音強度所對應的方向確定為人聲聲源的方向,并基于確定的人聲聲源方向,進行聲音增強等后續操作。但是上述技術方案存在如下缺陷:由于多個麥克風采集的多路聲音信號中存在噪聲干擾,所以如果僅僅使用最大聲音強度來確定音源方向,往往會將強度較大的噪聲識別為目標聲音,從而錯誤地將該噪聲的方向作為目標聲音的音源方向;另外,由于不能有選擇地區分人聲和非人聲,導致有可能將非人聲的其他聲音的方向確定為人聲方向的情況;再次,當與目標檢測聲音處于相同或類似頻率范圍內的其它較大強度聲音出現時,例如在有人正常發言時出現第三人意外大聲發聲或咳嗽等,則會引起錯誤地將所述其它較大強度聲音判斷為音源方向。
發明內容
針對上面提到的可能錯誤地將噪聲的方向判定為目標音源方向、將非人聲的方向判定為人聲方向以及錯誤地將與目標檢測聲音處于相同或類似頻率范圍內的其它較大強度聲音判斷為音源方向的問題,提出了音源定向方法及裝置,其中,定向判斷參數在每次進行音源方向判斷過程中實時更新以增大或減小,從而該定向判斷參數帶有相應累加聲音信號的歷史強度信息,避免了現有技術中僅僅根據聲音信號的當前強度信息進行音源方向判斷的缺點,為音源定向判斷提供了緩沖機制,從而避免了其它突發聲音對音源方向判斷的影響,使得能夠避免噪聲的干擾,環境適應性強,而且能夠有選擇地對特定聲音例如人聲進行音源定向,進一步排除其他非人聲信號的干擾,另外也能夠避免與目標檢測聲音處于相同或類似頻率范圍內的其它較大強度聲音的干擾,而且實現簡單,不涉及頻域計算,功耗低,配置靈活。
依據本發明的第一方面,提供了一種音源定向方法,其包括:
獲取多個聲音輸入信號;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州嘉楠耘智信息科技有限公司,未經杭州嘉楠耘智信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910117064.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:MEMS麥克風制造方法
- 下一篇:基于智能手機的智能嘯叫抑制裝置和方法





