[發明專利]多麥克風語音活動檢測器有效
| 申請號: | 201310046916.6 | 申請日: | 2009-06-25 |
| 公開(公告)號: | CN103137139A | 公開(公告)日: | 2013-06-05 |
| 發明(設計)人: | 俞容山 | 申請(專利權)人: | 杜比實驗室特許公司 |
| 主分類號: | G10L25/78 | 分類號: | G10L25/78 |
| 代理公司: | 中國國際貿易促進委員會專利商標事務所 11038 | 代理人: | 楊小明 |
| 地址: | 美國加*** | 國省代碼: | 美國;US |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 麥克風 語音 活動 檢測器 | ||
本申請是申請日為2009年6月25日、申請號為200980125256.2、發明名稱為“多麥克風語音活動檢測器”的發明專利申請的分案申請。
相關申請的交叉引用
本申請要求Rongshan?Yu于2008年6月30日提交的題目為“Multi-microphone?Voice?Activity?Detector(多麥克風語音活動檢測器)”的、并且已經轉讓給本申請的受讓人(Dolby實驗室參考號為:No.D08006US01)的共同未決的美國臨時專利申請No.61/077087的權益(包括優先權)。
技術領域
本發明涉及語音活動檢測器。更具體地,本發明的實施例涉及利用兩個或多個麥克風的語音活動檢測器。
背景技術
除非在此指出,否則本部分所描述的方案不是本申請中權利要求的現有技術,并且不會因為包含在本部分而被承認是現有技術。
語音活動檢測器(VAD)的一個功能在于檢測麥克風所記錄的音頻信號區域中存在或者不存在人的語音。在關于由VAD模塊所決定的語音是否存在于其中的輸入信號上使用的不同處理機制的上下文中,VAD在許多語音處理系統中起作用。在這些應用中,精確且魯棒的VAD性能可影響整體性能。例如,在語音通信系統中,DTX(不連續傳輸)通常被用來改善帶寬使用效率。在這種系統中,利用VAD確定輸入信號中是否存在語音,并且如果不存在語音,則停止語音信號的實際傳輸。這里,將語音錯分類為干擾會導致傳輸信號中的語音減弱,并影響其可理解性(intelligibility)。作為示例,在語音增強系統中,通常需要估計所記錄的信號中的干擾信號的水平(level)。這通常是在VAD的幫助下進行的,其中從僅包含干擾信號的部分估計干擾水平。例如,參見A.M.Kondoz的Digital?Speech?Coding?for?Low?Bit?Rate?Communication?Systems的第11章(John?Wiley&Sons,2004)。在這個例子中,不準確的VAD會導致干擾水平的過估計(over-estimate)或低估計(under-estimate),這最終會導致非最理想的(suboptimal)語音增強質量。
之前已經提出了多種VAD系統。例如,參見A.M.Kondoz撰寫的Digital?Speech?Coding?for?Low?Bit?Rate?Communication?Systems的第10章(John?Wiley&Sons,2004)。這些系統中的一些利用目標語音和干擾之間的差異的統計方面,并依賴閾值比較方法從干擾信號中區分出目標語音。原先用于這些系統中的統計測量包括能量水平、計時、音調、零相交率、周期測量等。多于一種統計測量的組合被用于更多的復雜系統,以進一步改善檢測結果的精度。通常,當目標語音和干擾具有非常明顯的統計特征時,例如當干擾具有穩定的并低于目標語音水平的水平時,統計方法取得好的性能。然而,在更不利的環境中,尤其在目標信號水平與干擾水平的比值低時或者干擾信號具有類似語音的特征時,保持好的性能變成非常具有挑戰性的任務。
在一些魯棒的自適應射束形成(adaptive?beamforming)系統設計中也可以發現與麥克風陣列組合的VAD。例如,參見O.Hoshuyama,B.Begasse,A.Sugiyama及A.Hirano的“A?real?time?robust?adaptive?microphone?array?controlled?by?an?SNR?estimate”,Procedings?of?the?1998IEEE?International?Conference?on?Acoustics,Speech?and?Signal?Processing,1998。那些VAD基于麥克風射束形成系統的不同輸出水平的差異,其中目標信號僅存在于一個輸出中并因為其他輸出而被阻塞。因此,這種VAD設計的有效性可以與射束形成系統在因為那些輸出而阻塞目標信號時的能力有關,在實時系統中獲取這種能力會是昂貴的。
與該背景有關的、但是不被認為是下文部分中將描述的示例性發明實施例的現有技術的其他參考包括:
參考1:A.M.Kondoz,“Digital?Speech?Coding?for?Low?Bit?Rate?Communication?Systems”,第10章(John?Wiley&Sons,2004);
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杜比實驗室特許公司,未經杜比實驗室特許公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310046916.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:臭蛋及其制造方法
- 下一篇:一種紅燒雞翅的制作方法





