[發明專利]一種基于頻譜包絡圖的可變時長語音的語種識別方法在審
| 申請號: | 202110238968.8 | 申請日: | 2021-03-04 |
| 公開(公告)號: | CN113112990A | 公開(公告)日: | 2021-07-13 |
| 發明(設計)人: | 龍華;王瑤;邵玉斌;杜慶治;王延凱;陳亮;唐維康 | 申請(專利權)人: | 昆明理工大學 |
| 主分類號: | G10L15/00 | 分類號: | G10L15/00;G10L15/04;G10L15/06;G10L15/18 |
| 代理公司: | 昆明明潤知識產權代理事務所(普通合伙) 53215 | 代理人: | 王鵬飛 |
| 地址: | 650093 云*** | 國省代碼: | 云南;53 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 頻譜 包絡 可變 語音 語種 識別 方法 | ||
本發明涉及一種基于頻譜包絡圖的可變時長語音的語種識別方法,屬于音頻信號處理技術領域。首先將語音信號分割為時長為t秒的短時語音;再提取出每段短時語音的頻譜包絡圖,并將這些頻譜包絡圖按a:b的比例分配為訓練集和測試集;然后將訓練集擬合到殘差網絡中進行訓練,通過調整模型參數和測試集的反復測試,選出識別率最高的語種識別模型;當待測語音的時長大于t秒時,將它們分割成為若干長度為t秒的短時語音,然后通過統計每一段長語音所分割得到的短語音的識別情況來判斷整段長語音得語種。本發明不僅能加快語種識別的速度,同時在待測語音時長不等的情況下也可以進行語種識別,并且能夠保證較高的準確率。
技術領域
本發明涉及一種基于頻譜包絡圖的可變時長語音的語種識別方法,屬于音頻信號處理技術領域。
背景技術
根據調查表明,全世界有超過6900種不同的語種,完全靠人工來對這些語種分類是非常復雜的。目前已經有很多的語言翻譯工具,而這些翻譯工具的前端都引用到了語種識別技術。當待測語音的時長不等時,由于訓練集不可能包含所有時長的語音信號,因此不同時長語音的語種識別效果會顯著下降。目前為了解決不同時長語音的語種識別問題,使用最廣泛的方法是改變語音的語速來調整時長,而這種方法雖然可以保持語音的頻域特征基本不變,但時域特征卻改變很大,語種的識別效果也不太理想。因此可變時長語音的語種識別還有巨大的研究空間。
發明內容
本發明要解決的技術問題是本發明提供一種基于頻譜包絡圖的可變時長語音的語種識別方法,用來解決當待測語音時長不等時造成語種識別效果急劇下降的問題。
本發明的技術方案是:一種基于頻譜包絡圖的可變時長語音的語種識別方法,主要分為兩個部分,第一個部分為短語音的語種識別(時長為1秒),第二部分為待測長語音的時長規整,即分割為若干時長為1秒的短語音信號。
在第一部分短語音的語種識別過程中,使用語音信號的頻譜包絡圖作為語種識別系統的特征輸入,其提取過程主要包括語音信號分幀、加窗函數和同態處理,求得短語音的每一幀頻譜包絡,再將這些頻譜包絡按行拼接起來,形成一段短語音(時長為1秒)的頻譜包絡圖,然后把這些頻譜包絡圖按4:1分配為訓練集和測試集,訓練集用來擬合到殘差網絡中形成語種識別模型,測試集用來對生成的語種識別模型進行測試,選出識別效果最好的語種識別模型。
第二部分主要內容就是將不同時長的長語音都分割為若干短語音(時長為1秒),然后將這些短語音送入語種識別系統中進行測試,通過統計這些短語音的識別情況來判別長語音的語種。
具體步驟為:
Step1:將不同語種的長段語音信號分割為時長較短的短時語音,將短時語音信號的時長定義為t秒。
Step2:對于時長為t秒的短時語音進行分幀、加窗函數,然后通過同態處理求出時長為t秒的短時語音的每一幀的頻譜包絡。
Step3:將同一短時語音的每一幀信號的頻譜包絡按行排列組合起來,繪制出每段語音對應的頻譜包絡圖,其橫軸代表頻譜、縱軸代表時域。
Step4:對生成的頻譜包絡圖進行濾波,去除語音信號的高頻和低頻部分,保留語音信號的中頻部分,使其頻率在500HZ到3000HZ的范圍內。
Step5:將每種語種的頻譜包絡圖按N:m分配為訓練集和測試集,并打上對應語種的標簽。
Step6:將訓練集擬合到殘差網絡,通過調整參數,訓練得到不同的語種識別模型,再用測試集對這些語種識別模型進行測試,挑選出語種識別率最高的語種識別模型。
Step7:當待測語音的時長不等時,將這些語音信號分割為若干的短時語音信號,時長為t秒,再將每段長語音分割得到的若干短語音擬合到Step6中的語種識別模型中,通過統計這些短語音的識別情況來判別時長語音的語種。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于昆明理工大學,未經昆明理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110238968.8/2.html,轉載請聲明來源鉆瓜專利網。





