[發明專利]一種音頻識別方法和裝置、以及聲學模型訓練方法和裝置在審
| 申請號: | 201910013485.0 | 申請日: | 2019-01-07 |
| 公開(公告)號: | CN111415654A | 公開(公告)日: | 2020-07-14 |
| 發明(設計)人: | 鄧耀;王飛 | 申請(專利權)人: | 北京嘀嘀無限科技發展有限公司 |
| 主分類號: | G10L15/06 | 分類號: | G10L15/06;G10L15/02;G10L15/08;G10L15/26;G10L25/03;G10L25/30 |
| 代理公司: | 北京超成律師事務所 11646 | 代理人: | 鄧超 |
| 地址: | 100193 北京*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 音頻 識別 方法 裝置 以及 聲學 模型 訓練 | ||
1.一種音頻識別方法,其特征在于,應用于移動終端,包括:
獲取用戶輸入的待識別音頻數據;
提取所述待識別音頻數據中的音頻特征;
將所述音頻特征輸入到預先訓練好的聲學模型中,得到與所述待識別音頻數據對應的音頻識別結果;其中,所述聲學模型以音節信息作為建模單元訓練得到的,所述音節信息包括單個文字的聲母和韻母。
2.根據權利要求1所述的音頻識別方法,其特征在于,所述將所述音頻特征輸入到預先訓練好的聲學模型中,得到與所述待識別音頻數據對應的音頻識別結果之后,所述方法還包括:
確定所述音頻識別結果對應的至少一個文本信息以及每個所述文本信息的命中概率;
從所述至少一個文本信息中,選取命中概率最高的目標文本信息作為匹配所述待識別音頻數據的文本信息。
3.根據權利要求2所述的音頻識別方法,其特征在于,所述選取命中概率最高的目標文本信息作為匹配所述待識別音頻數據的文本信息之后,所述方法還包括:
檢測選取的所述目標文本信息中是否存在預設分詞;
若所述目標文本信息中存在所述預設分詞,則將所述預設分詞以及所述預設分詞對應的目標文本信息和待識別音頻數據均發送給服務器,以使所述服務器基于所述預設分詞、所述目標文本信息和所述待識別音頻數據進行異常檢測。
4.一種聲學模型訓練方法,其特征在于,包括:
獲取樣本音頻數據;其中,所述樣本音頻數據對應有標注的音節信息,所述音節信息包括單個文字的聲母和韻母;
提取所述樣本音頻數據中每一個所述音節信息對應的音頻特征;
以所述音節信息作為建模單元,以所述建模單元對應的音頻特征作為初始聲學模型的輸入特征,以所述音節信息的跳轉概率作為所述初始聲學模型的輸出特征,構建聲學模型。
5.根據權利要求4所述的聲學模型訓練方法,其特征在于,所述提取所述樣本音頻數據中每一個所述音節信息對應的音頻特征,包括:
提取每一幀樣本音頻數據中的音頻特征;
基于所述樣本音頻數據標注的音節信息,確定每一個所述音節信息對應的至少一幀樣本音頻數據;
針對每一個音節信息,確定該音節信息對應的至少一幀樣本音頻數據的音頻特征,為該音節信息對應的音頻特征。
6.根據權利要求5所述的聲學模型訓練方法,其特征在于,所述音頻特征至少包括以下特征中的一種或多種:振幅特征、頻率特征、相位特征、梅爾頻率倒譜系數特征。
7.根據權利要求4所述的聲學模型訓練方法,其特征在于,通過以下方法確定所述初始聲學模型的模型層數:
基于所述樣本音頻數據中音節信息的個數,確定所述建模單元的個數;
基于所述建模單元的個數,確定所述初始聲學模型的模型層數。
8.根據權利要求7所述的聲學模型訓練方法,其特征在于,所述初始聲學模型包括以下網絡模型:長短期記憶網絡LSTM、深度神經網絡DNN和基于神經網絡的時序類分類CTC。
9.根據權利要求4~8任一項所述的聲學模型訓練方法,其特征在于,所述獲取樣本音頻數據,包括:
從預設的語料庫中選取包括預設分詞的目標文本信息;其中,所述語料庫中包括標注有文本信息的多個音頻文件;
選取所述目標文本信息對應的目標音頻文件,作為所述樣本音頻數據。
10.一種音頻識別裝置,其特征在于,所述裝置包括:第一獲取模塊、第一提取模塊和第一處理模塊;
所述第一獲取模塊,用于獲取用戶輸入的待識別音頻數據;
所述第一提取模塊,用于提取所述待識別音頻數據中的音頻特征;
所述第一處理模塊,用于將所述音頻特征輸入到預先訓練好的聲學模型中,得到與所述待識別音頻數據對應的音頻識別結果;其中,所述聲學模型以音節信息作為建模單元訓練得到的,所述音節信息包括單個文字的聲母和韻母。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京嘀嘀無限科技發展有限公司,未經北京嘀嘀無限科技發展有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910013485.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:具有豎直繞組的電感的制備方法及其壓注模具
- 下一篇:電子病歷的構建方法及裝置





