[發明專利]一種自適應門限整定語音端點檢測方法，設備及可讀存儲介質有效

申請號：	201810680909.4	申請日：	2018-06-27
公開（公告）號：	CN108847218B	公開（公告）日：	2020-07-21
發明（設計）人：	王曉宇	申請（專利權）人：	蘇州浪潮智能科技有限公司
主分類號：	G10L15/05	分類號：	G10L15/05;G10L25/93
代理公司：	濟南舜源專利事務所有限公司 37205	代理人：	張亮
地址：	215100 江蘇省蘇州市吳***	國省代碼：	江蘇;32
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	一種自適應門限語音端點檢測方法設備可讀存儲介質
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【權利要求書】：

1.一種自適應門限整定語音端點檢測方法，其特征在于，方法包括：

步驟1：設置待檢測的語音幀長為N,k為幀數，共有L幀數據，獲取L幀的短時參數，獲取第k幀的短時能量為amp，短時過零率為zcr；

步驟2：搜索參考噪音；

步驟3：獲取初始參考門限；

步驟4：檢測語音段起點x1和語音段終點x2；

步驟5：再次噪音提取，并獲取短時門限X⁽ⁱ⁺¹⁾；

步驟6：把第i+1次與第i次提取的門限值進行比較，判斷其是否相等。

2.根據權利要求1所述的自適應門限整定語音端點檢測方法，其特征在于，方法包括：

步驟6之后還包括：

若X⁽ⁱ⁺¹⁾＝X⁽ⁱ⁾，則算法收斂，輸出檢測結果。

3.根據權利要求1所述的自適應門限整定語音端點檢測方法，其特征在于，方法包括：

步驟6之后還包括：

若X⁽ⁱ⁺¹⁾≠X⁽ⁱ⁾，則i＝i+1，轉至步驟4，基于雙門限端點檢測，得到起點x1與終點x2；

再次噪音提取，并獲取短時門限X⁽ⁱ⁺¹⁾；

把第i+1次與第i次提取的門限值進行比較，判斷其是否相等；

若X⁽ⁱ⁺¹⁾＝X⁽ⁱ⁾，則算法收斂，輸出檢測結果；

若X⁽ⁱ⁺¹⁾≠X⁽ⁱ⁾，則i＝i+1，轉至步驟4，直至X⁽ⁱ⁺¹⁾＝X⁽ⁱ⁾，則算法收斂，輸出檢測結果。

4.根據權利要求3所述的自適應門限整定語音端點檢測方法，其特征在于，方法包括：

步驟6之后還包括：

若X⁽ⁱ⁺¹⁾≠X⁽ⁱ⁾，如轉至步驟4已達到預設次數時，輸出檢測結果。

5.根據權利要求1所述的自適應門限整定語音端點檢測方法，其特征在于，方法包括：

步驟2還包括：

從語音的終點為開始，與其相鄰幀作比較：記其前向搜索的幀數為m，終止幀為M；

從語音的起點為開始，與其相鄰幀作比較：記其后向搜索的幀數為n，終止幀為N；

若：Z(m+1)/Z(m)100,則停止搜索，M＝m；否則：m＝m+1，轉至步驟3；

若：Z(n-1)/Z(n)100,則停止搜索，N＝n；否則：n＝n+1，轉至步驟3。

6.根據權利要求1所述的自適應門限整定語音端點檢測方法，其特征在于，方法包括：

步驟3還包括：

設檢測到的前后段的背景噪聲短時能量的均值為amp_zy⁽ⁱ⁾，短時平均過零率為zcr_zy⁽ⁱ⁾，其中，M表示前向掃描的噪音幀數，N表示后向掃描的噪音幀數，i表示噪聲提取的次數，若i＝0，則表示開始初次噪音提取；用式amp_zy⁽ⁱ⁾和zcr_zy⁽ⁱ⁾計算初始參考門限。

7.根據權利要求1所述的自適應門限整定語音端點檢測方法，其特征在于，方法包括：

步驟4還包括：

根據待檢測語音的清音和濁音的邊界以及清音和無聲的邊界，獲取語音音波曲線；

預設語音的短時能量設定第一語音能量值門限閾值M₁；

根據第一語音能量值門限閾值M₁與語音音波曲線之間的兩個交點，將所述兩個交點確定為語音段的初始起始點和初始結束點；

預設語音的短時能量設定第二語音能量值門限閾值M₂，第一語音能量值門限閾值M₁大于第二語音能量值門限閾值M₂；

分別從初始起始點和初始結束點分別向兩邊搜索，獲取語音音波曲線與第二語音能量值門限閾值M₂之間的兩個交點，將所述兩個交點確定為語音段起點x1和語音段終點x2。

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于蘇州浪潮智能科技有限公司，未經蘇州浪潮智能科技有限公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201810680909.4/1.html，轉載請聲明來源鉆瓜專利網。

上一篇：一種語音切分方法、裝置、計算機設備及存儲介質
下一篇：一種喚醒詞預設置信度閾值調節方法及系統

同類專利

專利分類

G 物理

G10 樂器；聲學
G10L 語音分析或合成；語音識別；音頻分析或處理
G10L15-00 語音識別
G10L15-02 .語音識別的特征提取；識別單位的選擇
G10L15-04 .分段或字極限檢測
G10L15-06 .創建基準模板；訓練語音識別系統，例如對說話者聲音特征的適應
G10L15-08 .語音分類或檢索
G10L15-20 .專門適用于不利環境

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產權局專利說明書；

2、支持發明專利、實用新型專利、外觀設計專利（升級中）；

3、專利數據每周兩次同步更新，支持Adobe PDF格式；

4、內容包括專利技術的結構示意圖、流程工藝圖或技術構造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】