[發明專利]語音增強方法有效
| 申請號: | 201210008319.X | 申請日: | 2012-01-09 | 
| 公開(公告)號: | CN103000183A | 公開(公告)日: | 2013-03-27 | 
| 發明(設計)人: | 廖憲正 | 申請(專利權)人: | 財團法人工業技術研究院 | 
| 主分類號: | G10L21/02 | 分類號: | G10L21/02 | 
| 代理公司: | 北京律誠同業知識產權代理有限公司 11006 | 代理人: | 梁揮;常大軍 | 
| 地址: | 中國臺灣新竹*** | 國省代碼: | 中國臺灣;71 | 
| 權利要求書: | 查看更多 | 說明書: | 查看更多 | 
| 摘要: | |||
| 搜索關鍵詞: | 語音 增強 方法 | ||
技術領域
本發明涉及語音增強(speech?enhancement)技術。
背景技術
語音增強技術是一種將接收到的語音信號予以濾除不必要的噪音干擾以增強該語音內容的方法。其可使用于語音通訊、語音人機界面(user?voice?interface)、語音輸入(voice?input)及其它各種應用。近年來,隨著各種移動裝置、車用電子和機器人的快速發展,在具有噪音干擾的環境中進行語音通訊、語音輸入或語音人機互動的機率日漸提高,如何濾除噪聲以增強語音內容,提高語音通訊或語音人機互動的質量,成為此領域的重要課題。
一般而言,通過麥克風所擷取到的語音信號,均包含了目標音源和干擾音源。該干擾音源會造成語音通訊或語音人機互動的困難度升高。為提升語音通訊或語音人機互動的質量,勢必需要降低干擾音源對整體聲音信號所造成的干擾。先前許多語音增強技術使用了濾波器、適應性濾波器、統計模型等方法,結合單一麥克風來進行語音增強,然其效能均有其限制。近年來,使用多麥克風進行語音增強的技術因其效能普遍來說,較使用單一麥克風較佳,因此開始受到重視。然而,該類技術所需運算量較大,通常無法使用在運算資源受到限制的移動裝置上。因此,一搭配麥克風陣列且運算相對簡單的語音增強方法,而仍能達成有效降低干擾音源的目的,將會成為極具價值的發明。本發明即提供該語音增強方法。
發明內容
本發明的目的在于揭示一種語音增強方法,搭配麥克風陣列且運算相對簡單的語音增強方法,能達成有效降低干擾音源的目的。
為了達到上述目的,本發明揭示一種語音增強方法,包含下列步驟:利用一麥克風陣列接收多個音框的聲音信號;計算各音框的聲音信號于各頻段對應該多個麥克風中的至少一雙麥克風組合的兩耳時間差(inter-aural?time?difference);根據該計算結果統計各音框的聲音信號的兩耳時間差的累積直方圖(cumulative?histogram);根據該些累積直方圖計算一第一兩耳時間差門坎值;以及根據該第一兩耳時間差門坎值過濾該些音框的聲音信號。
本發明還揭示一種語音增強系統,包含一麥克風陣列、一累積直方圖模塊、一第一兩耳時間差門坎值計算模塊以及一聲音信號過濾模塊。該兩耳時間差計算模塊用以計算各音框的聲音信號于各頻段對應該多個麥克風中的至少一雙麥克風組合的兩耳時間差。該累積直方圖模塊用以計算各音框兩耳時間差的累積直方圖。該第一兩耳時間差門坎值計算模塊用以計算基于累積直方圖的第一兩耳時間差門坎值。該聲音信號過濾模塊用以過濾基于第一兩耳時間差門坎值的聲音信號。
本發明還揭示一種語音增強方法,包含下列步驟:利用一麥克風陣列接收多個音框的聲音信號;計算各音框的聲音信號于各頻段對應該多個麥克風中的至少一雙麥克風組合的兩耳時間差;根據該計算結果統計各音框的聲音信號的兩耳時間差的直方圖和累積直方圖;根據該些累積直方圖計算一第一兩耳時間差門坎值;根據該些直方圖和該第一兩耳時間差門坎值計算一第二兩耳時間差門坎值;以及根據該第一兩耳時間差門坎值和該第二兩耳時間差門坎值過濾該些音框的聲音信號。其中,該第二兩耳時間差門坎值大于該第一兩耳時間差門坎值。
本發明還揭示語音增強系統,包含一麥克風陣列、一累積直方圖模塊、一第一兩耳時間差門坎值計算模塊、一第二兩耳時間差門坎值計算模塊以及一聲音信號過濾模塊。該兩耳時間差計算模塊用以計算各音框的聲音信號于各頻段對應該多個麥克風中的至少一雙麥克風組合的兩耳時間差。該累積直方圖模塊用以計算各音框兩耳時間差的累積直方圖。該第一兩耳時間差門坎值計算模塊用以計算基于累積直方圖的第一兩耳時間差門坎值。該第二兩耳時間差門坎值計算模塊用以計算基于直方圖和該第一兩耳時間差門坎值的第二兩耳時間差門坎值。該聲音信號過濾模塊用以過濾基于第一兩耳時間差門坎值和該第二兩耳時間差門坎值的聲音信號。
也以下結合附圖和具體實施例對本發明進行詳細描述,但不作為對本發明的限定。
附圖說明
圖1顯示本發明的一實施例的語音增強系統的示意圖;
圖2顯示本發明的一實施例的語音增強方法的流程圖;
圖3顯示本發明的一實施例的聲音信號的時域和頻域圖;
圖4顯示本發明的一實施例所計算的兩耳時間差的累積直方圖;
圖5顯示本發明的另一實施例所計算的兩耳時間差的累積直方圖;
圖6顯示本發明的另一實施例的語音增強方法的流程圖;
圖7顯示本發明的一實施例所計算的兩耳時間差的直方圖;以及
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于財團法人工業技術研究院,未經財團法人工業技術研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210008319.X/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:熱鍛造用軋制棒鋼或線材
- 下一篇:方形無刷電機





