[發明專利]音頻識別方法、系統、移動終端及存儲介質有效
| 申請號: | 202010065691.9 | 申請日: | 2020-01-20 |
| 公開(公告)號: | CN111276133B | 公開(公告)日: | 2023-01-03 |
| 發明(設計)人: | 曾志先;肖龍源;李稀敏;蔡振華;劉曉葳;譚玉坤 | 申請(專利權)人: | 廈門快商通科技股份有限公司 |
| 主分類號: | G10L15/20 | 分類號: | G10L15/20;G10L15/26;G10L15/16;G10L15/22;G10L15/06;G10L15/02;G10L25/24 |
| 代理公司: | 廈門仕誠聯合知識產權代理事務所(普通合伙) 35227 | 代理人: | 樂珠秀 |
| 地址: | 361009 福建省廈門市*** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 音頻 識別 方法 系統 移動 終端 存儲 介質 | ||
本發明提供了一種音頻識別方法、系統、移動終端及存儲介質,該方法包括:獲取音頻數據將音頻文件轉換為音頻特征;對音頻特征進行標簽標注得到標簽數組;構建LSTM神經網絡模型,在LSTM神經網絡模型上封裝Attention網絡,在LSTM神經網絡模型中構建全連接層;對音頻特征進行數值標準化處理,將標準化處理后的音頻特征輸入LSTM神經網絡模型,以得到音頻概率結果;根據標簽數組對音頻概率結果進行損失計算,以得到損失值,根據損失值對LSTM神經網絡模型的模型參數進行迭代訓練;將待檢測音頻輸入LSTM神經網絡模型進行音頻識別,以得到音頻識別結果。本發明采用基于深度學習的方式進行音頻數據的識別,減少了錯誤識別的概率,提高了音頻識別的準確率。
技術領域
本發明屬于音頻識別技術領域,尤其涉及一種音頻識別方法、系統、移動終端及存儲介質。
背景技術
隨著音頻識別技術的不斷發展,該技術被應用于越來越多的場景中,例如家庭智能音箱,手機導航,無人購物超市等場景,通過音頻識別技術,智能設備可以完成與人的交互,并且根據人們的命令來做出相應的操作以及相應的回應。
現有的音頻識別技術使用的方法是持續監聽用戶的命令,并且當用戶不再發出語音命令時,音頻識別系統不再監聽,并將監聽到的音頻進行上傳到服務器,經過處理后做出相應的回應,通常音頻識別過程中會通過音頻的能量的進行有效音的判斷,先計算整段音頻的平均能量,然后將音頻中高于平均能量的音頻部分進行保留,而低于平均能量的音頻部分舍棄,這樣可以減少音頻的無效片段,減少傳輸數據量,減低識別錯誤率,但是該判斷方式由于判斷標準單一,僅通過平均值作為閾值判斷,有可能導致噪聲被保留,或者用戶較低音量的命令被刪除,進而降低了音頻識別的準確率。
發明內容
本發明實施例的目的在于提供一種音頻識別方法、系統、移動終端及存儲介質,旨在解決現有的音頻識別方法過程中識別準確率低下的問題。
本發明實施例是這樣實現的,一種音頻識別方法,所述方法包括:
獲取音頻數據,并將所述音頻數據中的音頻文件轉換為音頻特征;
對所述音頻特征進行標簽標注,并將標注結果進行存儲,以得到標簽數組;
構建LSTM神經網絡模型,在所述LSTM神經網絡模型上封裝Attention網絡,并在所述LSTM神經網絡模型中構建全連接層;
對所述音頻特征進行數值標準化處理,并將標準化處理后的所述音頻特征輸入所述LSTM神經網絡模型,以得到音頻概率結果;
根據所述標簽數組對所述音頻概率結果進行損失計算,以得到損失值,并根據所述損失值對所述LSTM神經網絡模型的模型參數進行迭代訓練;
將待檢測音頻輸入所述LSTM神經網絡模型進行音頻識別,以得到音頻識別結果。
更進一步的,所述將所述音頻數據中的音頻文件轉換為音頻特征的步驟包括:
將所述音頻文件轉換為40維度的MFCC特征,以使將所述音頻文件從時域轉換為頻域,且每幀所述MFCC特征的長度為0.025秒。
更進一步的,所述對所述音頻特征進行標簽標注的步驟包括:
分別對每幀所述音頻特征進行分類,以得到有效幀和無效幀;
對所述有效幀進行第一標識標記,對所述無效幀進行第二標識標記,以得到所述標簽數組,且每個音頻對應一個所述標簽數組。
更進一步的,所述對所述音頻特征進行數值標準化處理的步驟包括:
計算所述音頻特征的平均值和標準差,并根據所述平均值和所述標準差依序對每個所述音頻特征進行標準化處理。
更進一步的,所述標準化處理所述采用的計算公式為:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廈門快商通科技股份有限公司,未經廈門快商通科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010065691.9/2.html,轉載請聲明來源鉆瓜專利網。





