[發明專利]語音識別系統的端點檢測方法及系統有效
| 申請號: | 201510413643.3 | 申請日: | 2015-07-14 |
| 公開(公告)號: | CN105118502B | 公開(公告)日: | 2017-05-10 |
| 發明(設計)人: | 王凱夫;彭守業;牛建偉;賈磊 | 申請(專利權)人: | 百度在線網絡技術(北京)有限公司 |
| 主分類號: | G10L15/04 | 分類號: | G10L15/04;G10L15/02;G10L15/16;G10L21/0208 |
| 代理公司: | 北京清亦華知識產權代理事務所(普通合伙)11201 | 代理人: | 宋合成 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 識別 系統 端點 檢測 方法 | ||
1.一種語音識別系統的端點檢測方法,其特征在于,包括以下步驟:
基于長短時記憶神經網絡訓練聲學識別模型;
通過預設語音端點檢測算法初步識別出待識別語音信號的語音端點;
分幀提取所述待識別語音信號的語音特征信息,并將所述語音特征信息輸入所述聲學識別模型,以使所述聲學識別模型根據所述語音特征信息生成所述待識別語音信號的聲學識別結果;以及
根據所述聲學識別結果對初步識別出的語音端點進行調整;
其中,所述根據所述聲學識別結果對初步識別出的語音端點進行調整,包括:
判斷所述聲學識別結果中是否包含韻母;以及
如果所述聲學識別結果中包含韻母,則確定所述聲學識別結果中的第一個韻母所在的幀,并獲取在所述第一個韻母所在的幀之前,且距離所述第一個韻母所在的幀最近的非語音幀,并根據所述最近的非語音幀的下一幀對初始識別出的語音起始點進行調整。
2.如權利要求1所述的語音識別系統的端點檢測方法,其特征在于,所述基于長短時記憶神經網絡訓練聲學識別模型,包括:
對訓練庫中的語音數據進行分幀處理,并對每幀語音數據的聲學特征信息進行人工標注,其中,所述聲學特征信息包括靜音、聲母和韻母;
提取每幀語音數據的語音特征信息;
將所述語音特征信息作為所述長短時記憶神經網絡的輸入特征,并將所述聲學特征信息作為所述長短時記憶神經網絡的輸出特征,通過所述長短時記憶神經網絡對所述聲學識別模型進行訓練。
3.如權利要求1所述的語音識別系統的端點檢測方法,其特征在于,還包括:
如果所述聲學識別結果中包含韻母或者聲母,則確定所述聲學識別結果中的最后一個靜音所在的幀;以及
獲取距離所述最后一個靜音所在的幀最近的語音幀,并根據所述最近的語音幀對初始識別出的語音結束點進行調整。
4.如權利要求1-3任一項所述的語音識別系統的端點檢測方法,其特征在于,所述預設語音端點檢測算法包括基于順序統計濾波的實時語音端點檢測算法,其中,所述通過預設語音端點檢測算法初步識別出待識別語音信號的語音端點,包括:
對所述待識別語音信號進行分幀處理,并對每幀待識別語音信號進行FFT運算,以獲得每幀待識別語音信號的語音頻譜;
將所述每幀待識別語音信號的語音頻譜劃分為預設數量個子帶;
計算每幀待識別語音信號的最高頻子帶與最低頻子帶的能量比,并根據所述能量比和第一預設閾值估計背景噪聲,以及計算所述背景噪聲的能量;以及
計算每幀待識別語音信號的信噪比,并根據第二預設閾值和所述信噪比對待識別語音信號的語音端點進行初步識別。
5.如權利要求4所述的語音識別系統的端點檢測方法,其特征在于,所述根據第二預設閾值和每幀待識別語音信號的信噪比對所述待識別語音信號的語音端點進行初步識別,包括:
判斷當前幀待識別語音信號的信噪比是否大于所述第二預設閾值;
如果所述當前幀待識別語音信號的信噪比大于所述第二預設閾值,則將所述當前幀待識別語音信號判斷為語音幀,并進一步判斷在所述當前幀待識別語音信號之前是否有其他幀的待識別語音信號被判斷為語音幀,如果否,則將所述當前幀待識別語音信號初步判定為所述待識別語音信號的語音起始點。
6.如權利要求5所述的語音識別系統的端點檢測方法,其特征在于,還包括:
如果所述當前幀待識別語音信號的信噪比小于或者等于所述第二預設閾值,則將所述當前幀待識別語音信號判斷為非語音幀,并進一步判斷在所述當前幀待識別語音信號之前是否有其他幀的待識別語音信號被初步判定為所述語音起始點,如果是,則將所述當前幀待識別語音信號初步判定為所述待識別語音信號的語音結束點。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于百度在線網絡技術(北京)有限公司,未經百度在線網絡技術(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510413643.3/1.html,轉載請聲明來源鉆瓜專利網。





