[發明專利]端點檢測方法以及使用該方法的系統無效
| 申請號: | 200910135606.5 | 申請日: | 2009-04-22 |
| 公開(公告)號: | CN101872616A | 公開(公告)日: | 2010-10-27 |
| 發明(設計)人: | 張之浩;劉昆;吳偉國 | 申請(專利權)人: | 索尼株式會社 |
| 主分類號: | G10L15/00 | 分類號: | G10L15/00;G10L15/04;G10L11/02 |
| 代理公司: | 北京市柳沈律師事務所 11105 | 代理人: | 黃小臨 |
| 地址: | 日本*** | 國省代碼: | 日本;JP |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 端點 檢測 方法 以及 使用 系統 | ||
1.一種語音端點檢測方法,該方法包括步驟:
輸入語音信號;
對語音信號進行分幀并進行加漢明窗處理;
對語音信號執行時域到頻域的轉換;
針對語音信號逐幀進行基頻提取處理;
將語音信號中能夠提取到具有語音特性的基頻的信號區段判斷為確定語音信號區段;以及
將語音信號中未能提取到具有語音特性的基頻的信號區段判斷為包含噪聲的信號區段。
2.如權利要求1所述的語音端點檢測方法,其中,所述針對語音信號逐幀進行基頻提取處理的步驟包括:對語音信號進行諧波疊加處理,并計算每幀信號進行多次疊加后的諧波和,并將對應于諧波和最大值的頻率確定為相應幀的基頻。
3.如權利要求1所述的語音端點檢測方法,其中,所述將語音信號中能夠提取到具有語音特性的基頻的信號區段判斷為確定語音信號區段的步驟包括將語音信號中能夠提取到具有語音特性的基頻且其諧波在該信號區內呈水平直線的特點的信號區段判斷為確定音樂區段。
4.如權利要求1-3之一所述的語音端點檢測方法,其中,所述將語音信號中能夠提取到具有語音特性的基頻的信號區段判斷為確定語音信號區段的步驟包括將語音信號中能夠提取到具有語音特性的基頻的信號區段判斷為確定元音區段。
5.如權利要求1所述的語音端點檢測方法,其中,所述將語音信號中未能提取到具有語音特性的基頻的信號區段判斷為包含噪聲的信號區段的步驟包括:
在語音信號的相應幀中沒有基頻的情況下將所述相應幀判斷為包含噪聲的信號區段;
在語音信號的相應幀中所提取的基頻小于正常語音的基頻的最小值的情況下將所述相應幀判斷為包含噪聲的信號區段;以及
在語音信號的相應幀中所提取的基頻大于正常語音的基頻的最小值的情況下,計算所述相應幀的自相關系數,并將所述相應幀的自相關系數小于預定自相關系數閾值的所述相應幀判斷為包含噪聲的信號區段。
6.如權利要求1所述的語音端點檢測方法,其中,所述將語音信號中未能提取到具有語音特性的基頻的信號區段判斷為包含噪聲的信號區段的步驟包括將所述相應幀的基頻設置為零。
7.如權利要求1或6所述的語音端點檢測方法,其還包括步驟:
在連續出現未能提取到具有語音特性的基頻的情況下,判斷連續多幀的時長T是否大于或等于預定的時間閾值,如果時長T小于預定的時間閾值,則將該時長為T的包含噪聲的信號區段確定為潛在噪聲區段;如果時長T大于或等于預定的時間閾值,則將該時長為T的包含噪聲的信號區段的中間部分確定為確定噪聲區段,而將所述包含噪聲的信號區段的在所述確定噪聲區段兩端的部分確定為潛在噪聲區段;以及
比較所述確定噪聲區段與所述潛在噪聲區段在相同頻域上的能量以便確定所述潛在噪聲區段是確定噪聲區段還是輔音或元音的尾音。
8.如權利要求7所述的語音端點檢測方法,其中所述比較所述確定噪聲區段與所述潛在噪聲區段在相同頻域上的能量以便確定所述潛在噪聲區段是確定噪聲區段還是輔音或元音的尾音的步驟包括:
將所述包含噪聲的信號區段的信號進行分幀并進行加漢明窗處理;
將所述包含噪聲的信號區段的信號從時域信號轉換為頻域信號;
將所述確定噪聲區段在頻域上劃分為高頻子帶和低頻子帶;
將所述高頻子帶和低頻子帶各自再劃分為兩個子帶;
基于針對所述確定噪聲區段的子帶劃分方式在頻域上將所述潛在噪聲區段劃分成對應的子帶;以及
比較所述確定噪聲區段和所述潛在噪聲區段的對應子帶的能量,從而確定所述潛在噪聲區段是確定噪聲區段還是輔音或元音的尾音。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于索尼株式會社,未經索尼株式會社許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200910135606.5/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:沖浪板手把
- 下一篇:配套快速液壓鉗的線纜切斷組件





