[發明專利]一種自適應門限整定語音端點檢測方法,設備及可讀存儲介質有效
| 申請號: | 201810680909.4 | 申請日: | 2018-06-27 |
| 公開(公告)號: | CN108847218B | 公開(公告)日: | 2020-07-21 |
| 發明(設計)人: | 王曉宇 | 申請(專利權)人: | 蘇州浪潮智能科技有限公司 |
| 主分類號: | G10L15/05 | 分類號: | G10L15/05;G10L25/93 |
| 代理公司: | 濟南舜源專利事務所有限公司 37205 | 代理人: | 張亮 |
| 地址: | 215100 江蘇省蘇州市吳*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 自適應 門限 語音 端點 檢測 方法 設備 可讀 存儲 介質 | ||
1.一種自適應門限整定語音端點檢測方法,其特征在于,方法包括:
步驟1:設置待檢測的語音幀長為N,k為幀數,共有L幀數據,獲取L幀的短時參數,獲取第k幀的短時能量為amp,短時過零率為zcr;
步驟2:搜索參考噪音;
步驟3:獲取初始參考門限;
步驟4:檢測語音段起點x1和語音段終點x2;
步驟5:再次噪音提取,并獲取短時門限X(i+1);
步驟6:把第i+1次與第i次提取的門限值進行比較,判斷其是否相等。
2.根據權利要求1所述的自適應門限整定語音端點檢測方法,其特征在于,方法包括:
步驟6之后還包括:
若X(i+1)=X(i),則算法收斂,輸出檢測結果。
3.根據權利要求1所述的自適應門限整定語音端點檢測方法,其特征在于,方法包括:
步驟6之后還包括:
若X(i+1)≠X(i),則i=i+1,轉至步驟4,基于雙門限端點檢測,得到起點x1與終點x2;
再次噪音提取,并獲取短時門限X(i+1);
把第i+1次與第i次提取的門限值進行比較,判斷其是否相等;
若X(i+1)=X(i),則算法收斂,輸出檢測結果;
若X(i+1)≠X(i),則i=i+1,轉至步驟4,直至X(i+1)=X(i),則算法收斂,輸出檢測結果。
4.根據權利要求3所述的自適應門限整定語音端點檢測方法,其特征在于,方法包括:
步驟6之后還包括:
若X(i+1)≠X(i),如轉至步驟4已達到預設次數時,輸出檢測結果。
5.根據權利要求1所述的自適應門限整定語音端點檢測方法,其特征在于,方法包括:
步驟2還包括:
從語音的終點為開始,與其相鄰幀作比較:記其前向搜索的幀數為m,終止幀為M;
從語音的起點為開始,與其相鄰幀作比較:記其后向搜索的幀數為n,終止幀為N;
若:Z(m+1)/Z(m)100,則停止搜索,M=m;否則:m=m+1,轉至步驟3;
若:Z(n-1)/Z(n)100,則停止搜索,N=n;否則:n=n+1,轉至步驟3。
6.根據權利要求1所述的自適應門限整定語音端點檢測方法,其特征在于,方法包括:
步驟3還包括:
設檢測到的前后段的背景噪聲短時能量的均值為amp_zy(i),短時平均過零率為zcr_zy(i),其中,M表示前向掃描的噪音幀數,N表示后向掃描的噪音幀數,i表示噪聲提取的次數,若i=0,則表示開始初次噪音提取;用式amp_zy(i)和zcr_zy(i)計算初始參考門限。
7.根據權利要求1所述的自適應門限整定語音端點檢測方法,其特征在于,方法包括:
步驟4還包括:
根據待檢測語音的清音和濁音的邊界以及清音和無聲的邊界,獲取語音音波曲線;
預設語音的短時能量設定第一語音能量值門限閾值M1;
根據第一語音能量值門限閾值M1與語音音波曲線之間的兩個交點,將所述兩個交點確定為語音段的初始起始點和初始結束點;
預設語音的短時能量設定第二語音能量值門限閾值M2,第一語音能量值門限閾值M1大于第二語音能量值門限閾值M2;
分別從初始起始點和初始結束點分別向兩邊搜索,獲取語音音波曲線與第二語音能量值門限閾值M2之間的兩個交點,將所述兩個交點確定為語音段起點x1和語音段終點x2。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于蘇州浪潮智能科技有限公司,未經蘇州浪潮智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810680909.4/1.html,轉載請聲明來源鉆瓜專利網。





