[發明專利]噪聲環境下語音端點的檢測方法在審
| 申請號: | 201710255549.9 | 申請日: | 2017-04-19 |
| 公開(公告)號: | CN106991998A | 公開(公告)日: | 2017-07-28 |
| 發明(設計)人: | 林海波;程呂鵬 | 申請(專利權)人: | 重慶郵電大學 |
| 主分類號: | G10L15/04 | 分類號: | G10L15/04;G10L21/02;G10L25/45;G10L25/84;G10L25/87 |
| 代理公司: | 重慶蘊博君晟知識產權代理事務所(普通合伙)50223 | 代理人: | 王玉芝,田東陽 |
| 地址: | 400065 重*** | 國省代碼: | 重慶;85 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 噪聲 環境 語音 端點 檢測 方法 | ||
1.一種噪聲環境下語音端點的檢測方法,包括:
步驟1:根據人耳的基底膜的聽覺特性將20~22050Hz的頻率范圍分成25個頻率群;
步驟2:計算與每個頻率群相對應的不等帶寬子帶的方差Di;
步驟3:根據計算出的頻率群的不等帶寬子帶的方差Di,通過單參數雙門限法檢測語音信號的起止端點。
2.如權利要求1所述的噪聲環境下語音端點的檢測方法,其中,每個頻率群中的中心頻率、臨界帶寬、下限頻率和上限頻率分別代表一項參數,且所述中心頻率、所述下限頻率和所述上限頻率被構成一個3×25維的數組。
3.如權利要求2所述的噪聲環境下語音端點的檢測方法,其中,在計算每個頻率群的不等帶寬子帶的方差的過程中,包括:
步驟21:根據語音信號x(n)的采樣頻率fs,求出在(0~fs/2)頻率區間內的不等帶寬子帶的數量q;
步驟22:對所述語音信號x(n)進行加窗分幀處理得到第i幀的語音信號xi(m),經快速傅氏變換后得到(N/2+1)條正頻率幅值譜線Xi,Xi={Xi(1),Xi(2),...,Xi(N/2+1)},i=0,1,2,...,N為幀長;
步驟23:通過內插的方法對(N/2+1)條正頻率幅值譜線Xi進行擴展;
步驟24:計算每個不等帶寬子帶內頻譜的平均幅值Ei(j):
式中,fj,l——第j個不等帶寬子帶的低頻臨界帶寬;
fj,h——第j個不等帶寬子帶的高頻臨界帶寬;
步驟25:計算(0~fs/2)頻率區間內q個不等帶寬子帶的均值計算公式為:
步驟26:根據所述與所述Ei(j)計算q個不等帶寬子帶的方差Di,計算公式為:
4.如權利要求1所述的噪聲環境下語音端點的檢測方法,其中,在根據計算出的頻率群的不等帶寬子帶的方差,通過單參數雙門限法檢測語音信號的起止端點的過程中,包括:
步驟31:根據所述語音信號的前導無話段計算噪聲段的平均方差值,并可設置閾值T1和T2;
步驟32:根據所述閾值T1和所述閾值T2,通過所述單參數雙門限法檢測語音信號的起止位置。
5.如權利要求4所述的噪聲環境下語音端點的檢測方法,其中,在根據所述閾值T1和所述閾值T2,通過所述單參數雙門限法檢測語音信號的起止位置的過程中,當所述Di高于所述閾值T1時,判斷為所述語音信號的起點,當所述Di高于所述閾值T2時,判斷為所述語音信號的端點;其中,所述閾值T1和所述閾值T2取所述Di的原始數據上的數值或取所述Di的原始數據經過平滑處理后的數值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于重慶郵電大學,未經重慶郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710255549.9/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種真空隔熱排氣消音器
- 下一篇:語音識別方法及裝置





