[發明專利]一種基于BP神經網絡的本地語音識別方法無效
| 申請號: | 201310430537.7 | 申請日: | 2013-09-18 |
| 公開(公告)號: | CN103514879A | 公開(公告)日: | 2014-01-15 |
| 發明(設計)人: | 孫建華 | 申請(專利權)人: | 廣東歐珀移動通信有限公司 |
| 主分類號: | G10L15/16 | 分類號: | G10L15/16;G10L15/06 |
| 代理公司: | 廣州市華學知識產權代理有限公司 44245 | 代理人: | 李盛洪 |
| 地址: | 523860 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 bp 神經網絡 本地 語音 識別 方法 | ||
1.一種基于BP神經網絡的本地語音識別方法,其特征在于,具體步驟如下:
(1)用戶針對系統中的各操作,分別在系統中輸入相應的語音,通過系統建立操作和語音的命令集映射對,作為BP神經網絡的原始訓練集,對BP神經網絡進行訓練,所述語音為用戶輸入的原始語音信息,系統對其進行預處理及特征參數提取,將提取的特征參數值輸入到BP神經網絡的輸入端,所述操作為系統執行的應用程序,所述操作對應的應用程序包名為BP神經網絡的輸出;
(2)BP神經網絡的訓練完后,用戶向系統輸入語音數據,系統首先對用戶輸入的語音數據進行預處理及提取語音的特征參數值,語音的特征參數值經過BP神經網絡進行傳播,將神經網絡實際輸出值與所有的期望值進行比較;
若有其中一個誤差值小于預先設定的誤差值,則將該誤差對應的輸出作為語音識別的最終輸出;然后進入步驟(3);
若所有的誤差值均大于預先設定的誤差值,則進入步驟(4);
(3)系統識別BP神經網絡輸出的應用程序的包名,調用包名相應的應用程序,執行應用程序相應的操作;
(4)將所有的誤差值在BP神經網絡中反向傳播,作為BP神經網絡的輸入,從而修正各個節點單元的權值;
若當前學習次數小于預先設定的學習次數,則繼續傳播,直到其中一個誤差值小于預先設定的誤差值為止;
若當前學習次數大于預先設定的學習次數時,還未出現一個誤差值小于預先設定的誤差值,則結束訓練,并且由系統作出無法找到應用程序的提示。
2.根據權利要求1所述的基于BP神經網絡的本地語音識別方法,其特征在于,所述步驟(1)中,操作和語音命令集映射對中操作的應用程序包名存放在系統的ArrayList中;ArrayList中包名的個數和BP神經網絡輸出層的輸出維數相同。
3.根據權利要求1所述的基于BP神經網絡的本地語音識別方法,其特征在于,所述步驟(1)和步驟(2)中語音的特征參數值的個數為6,所述BP神經網絡的輸入層的輸入維數和語音的特征參數值的個數相同;所述語音的特征參數為能量、幅度、過零率、頻譜、倒譜和功率譜。
4.根據權利要求1所述的基于BP神經網絡的本地語音識別方法,其特征在于,所述步驟(1)和步驟(2)中語音的預處理包括對語音依次進行預加重、加窗分幀和端點檢測處理。
5.根據權利要求1所述的基于BP神經網絡的本地語音識別方法,其特征在于,所述操作和語音的命令集映射對中,包含有多個語音映射同一個操作的情況。
6.根據權利要求1所述的基于BP神經網絡的本地語音識別方法,其特征在于,所述步驟(2)中,預先設定的誤差值為0.000001。
7.根據權利要求1所述的基于BP神經網絡的本地語音識別方法,其特征在于,所述步驟(3)中預先設定的學習次數為1000。
8.根據權利要求1所述的基于BP神經網絡的本地語音識別方法,其特征在于,系統在建立操作和語音的命令集映射對過程中,用戶根據操作的作用輸入相應的語音。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣東歐珀移動通信有限公司,未經廣東歐珀移動通信有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310430537.7/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:高效去除復合不銹鋼管焊縫余高的裝置
- 下一篇:具有多層油漆涂層的電子汽車衡





