[發明專利]語音增強方法有效

申請號：	201210008319.X	申請日：	2012-01-09
公開（公告）號：	CN103000183A	公開（公告）日：	2013-03-27
發明（設計）人：	廖憲正	申請（專利權）人：	財團法人工業技術研究院
主分類號：	G10L21/02	分類號：	G10L21/02
代理公司：	北京律誠同業知識產權代理有限公司 11006	代理人：	梁揮;常大軍
地址：	中國臺灣新竹***	國省代碼：	中國臺灣;71
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	語音增強方法
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【權利要求書】：

1.一種語音增強方法，其特征在于，包含下列步驟：

利用一雙麥克風式的麥克風陣列接收多個音框的聲音信號；

計算各音框的聲音信號于各頻段對應該雙麥克風式的麥克風陣列的兩耳時間差；

根據該計算結果統計各音框的聲音信號的兩耳時間差的累積直方圖；

根據該些累積直方圖計算一第一兩耳時間差門坎值；以及

根據該第一兩耳時間差門坎值過濾該些音框的聲音信號。

2.根據權利要求1所述的語音增強方法，其特征在于，該計算第一兩耳時間差門坎值的步驟包含下列次步驟：

計算該些累積直方圖于各兩耳時間差的變異數；以及

決定該些變異數的最大值所對應的兩耳時間差為該第一兩耳時間差門坎值。

3.根據權利要求1所述的語音增強方法，其特征在于，該變異數的計算根據一先前計算的變異數以遞歸方式計算出一更新的變異數。

4.根據權利要求1所述的語音增強方法，其特征在于，該過濾聲音信號的步驟包含下列次步驟：

尋找該些音框的聲音信號于各頻段的兩耳時間差高于該第一兩耳時間差門坎值的過濾頻段，并濾除該些音框的聲音信號于該些過濾頻段的成分。

5.根據權利要求4所述的語音增強方法，其特征在于，該濾除聲音信號的步驟可由下列式子表示：

γ(k₀，m₀)代表第m₀個音框于第k₀個頻段的過濾值，d(k₂，m₀)代表第m₀個音框于第k₀個頻段的兩耳時間差，τ₁代表該第一兩耳時間差門坎值，η為一最小單元變量。

6.根據權利要求5所述的語音增強方法，其特征在于，η等于0.01。

7.根據權利要求4所述的語音增強方法，其特征在于，該濾除聲音信號的步驟可由下列式子表示：

γ(k₀，m₀)代表第m₀個音框于第k₀個頻段的過濾值，d(k₀,m₀)代表第m₀個音框于第k₀個頻段的兩耳時間差，τ₁代表該第一兩耳時間差門坎值，β為一控制過濾程度的變量。

8.一種語音增強方法，其特征在于，包含下列步驟：

利用一雙麥克風式的麥克風陣列接收多個音框的聲音信號；

計算各音框的聲音信號于各頻段對應該雙麥克風式的麥克風陣列的兩耳時間差；

根據該計算結果統計各音框的聲音信號的兩耳時間差的直方圖和累積直方圖；

根據該些累積直方圖計算一第一兩耳時間差門坎值；

根據該些直方圖和該第一兩耳時間差門坎值計算一第二兩耳時間差門坎值；以及

根據該第一兩耳時間差門坎值和該第二兩耳時間差門坎值過濾該些音框的聲音信號；

其中該第二兩耳時間差門坎值大于該第一兩耳時間差門坎值。

9.根據權利要求8所述的語音增強方法，其特征在于，該計算第一兩耳時間差門坎值的步驟包含下列次步驟：

計算該些累積直方圖于各兩耳時間差的變異數；以及

決定該些變異數的最大值所對應的兩耳時間差為該第一兩耳時間差門坎值。

10.根據權利要求9所述的語音增強方法，其特征在于，該變異數的計算根據一先前計算的變異數以遞歸方式計算出一更新的變異數。

11.根據權利要求8所述的語音增強方法，其特征在于，該計算第二兩耳時間差門坎值的步驟包含下列次步驟：

根據該些直方圖計算目標音源和干擾音源的訊雜比；以及

根據該目標音源和干擾音源的訊雜比、該干擾音源所對應的兩耳時間差和該第一兩耳時間差門坎值決定該第二兩耳時間差門坎值。

12.根據權利要求11所述的語音增強方法，其特征在于，該訊雜比為該些直方圖所決定的目標音源和干擾音源對應的數值的比例。

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于財團法人工業技術研究院，未經財團法人工業技術研究院許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201210008319.X/1.html，轉載請聲明來源鉆瓜專利網。

專利分類

專利文獻下載