[發明專利]一種基于改進MFCC算法的嵌入式語音識別系統及方法在審
| 申請號: | 201811603216.1 | 申請日: | 2018-12-26 |
| 公開(公告)號: | CN109448700A | 公開(公告)日: | 2019-03-08 |
| 發明(設計)人: | 任彬;趙增旭;佟寬章;胡佳輝 | 申請(專利權)人: | 石家莊鐵道大學 |
| 主分類號: | G10L15/00 | 分類號: | G10L15/00;G10L15/06;G10L15/02;G10L15/20;G10L25/24 |
| 代理公司: | 北京遠創理想知識產權代理事務所(普通合伙) 11513 | 代理人: | 張素妍 |
| 地址: | 050043 河北省石家莊*** | 國省代碼: | 河北;13 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音信號 語音識別系統 特征模板 訓練模式 主控系統 嵌入式 算法 匹配 預處理 混合特征參數 用戶輸入語音 用戶語音信號 端點檢測 藍牙模塊 數據覆蓋 特征參數 特征匹配 特征提取 無線控制 用戶指定 語音識別 預先存儲 起始點 改進 存儲 采集 | ||
本發明涉及一種基于改進MFCC算法的嵌入式語音識別系統及方法,其包括:進入識別模式,采集用戶語音信號并進行預處理;對語音信號進行端點檢測,確定語音信號的起始點和結束點;對語音信號進行特征提取得到12維的混合特征參數,即為用戶輸入語音信號的全部特征;將得到的特征參數與主控系統內預先存儲的特征模板進行匹配,若匹配,則得到最終的識別結果;反之,則重新進行識別模式;通過藍牙模塊無線控制用戶指定的設備;選擇進入訓練模式;用戶選擇訓練模板的存放點,若各個模板存放點都已存有模板,則需要用戶選擇其中一個存放點進行數據覆蓋;進入訓練模式,并得到訓練模板,存入到主控系統的特征模板存儲區內,用于語音識別的特征匹配。
技術領域
本發明涉及一種嵌入式語音識別系統及方法,特別是關于一種基于改進MFCC算法的嵌入式語音識別系統及方法。
背景技術
通過語音識別,用戶不必按下按鍵或做其他的復雜操作,而僅需發出語音指令,即可控制機械設備的運行,此外移動端設備通過語音識別,能夠快速地將語音信號轉化成文字。語音識別技術提高了人類地生產生活效率,于此同時,語音識別是人工智能的重要研究方向,具有廣闊的發展前進。
目前,許多國家都將語音識別作為重點研究項目,許多公司也推出了語音識別產品。現有語音識別系統存在以下問題:1、語音識別系統需要借助強大的運算平臺做支撐,用戶須將語音信號傳入云端,在線獲得識別結果,這樣的方式加大了語音識別的成本,并不適用于自動控制,移動設備等對成本要求較高的領域。2、語音識別平臺在移動端上具有運用廣泛且識別率較高的優點,但其并不能識別小語種或地方語言,具有一定的局限性。
發明內容
針對上述問題,本發明的目的是提供一種基于改進MFCC算法的嵌入式語音識別系統及方法,其能夠實現多種設備的語音控制,并克服現有技術中無法識別小語種或地方語言的問題。
為實現上述目的,本發明采取以下技術方案:一種基于改進MFCC算法的嵌入式語音識別方法,其包括以下步驟:1)啟動語音識別系統,顯示菜單界面,并判斷語音識別系統是否是第一次使用,若是,則進入步驟9),反之則進入步驟2);2)通過語音識別系統上的菜單鍵選擇進入識別模式;3)語音識別系統中的主控系統通過采樣電路開始采集用戶語音信號;4)主控系統對采集到的語音信號進行預處理;5)預處理完成后,主控系統對語音信號進行端點檢測,確定語音信號的起始點和結束點;6)端點檢測完成后,主控系統對語音信號進行特征提取,得到12維的混合特征參數,該12維的混合特征參數即為用戶輸入語音信號的全部特征;7)對語音信號的特征提取完成后,主控系統將得到的特征參數與主控系統內預先存儲的特征模板進行匹配,若匹配,則得到最終的識別結果;反之,則重新進行識別模式;8)由語音識別系統中的LCD顯示屏顯示識別結果,并通過語音識別系統的藍牙模塊無線控制用戶指定的設備;9)通過菜單鍵選擇進入訓練模式;10)用戶通過菜單鍵選擇訓練模板的存放點,若各個模板存放點都已存有模板,則需要用戶選擇其中一個存放點進行數據覆蓋;11)選擇完訓練模板的存放點后,正式進入訓練模式,并得到訓練模板,存入到主控系統的特征模板存儲區內,用于語音識別的特征匹配。
進一步,所述步驟5)中,主控系統對語音信號進行端點檢測的方法包括以下步驟:5.1)主控系統提取識別前200ms的語音信號作為背景噪聲,依據噪聲信息和語音信息的短時平均幅度值的差異,根據單位時間跨過正負閾值的次數設置相應門限;5.2)設定當語音信號超過正負閾值之一或者同時超過正負閾值時,并超過預先設定的時間,則將此作為語音的起始點;設定語音信號同時低于正負閾值,并超過預先設定時間,則將此作為語音的結束點。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于石家莊鐵道大學,未經石家莊鐵道大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811603216.1/2.html,轉載請聲明來源鉆瓜專利網。





