[發明專利]語音識別方法、裝置、終端和計算機可讀存儲介質有效
| 申請號: | 201710964474.1 | 申請日: | 2017-10-17 |
| 公開(公告)號: | CN107644638B | 公開(公告)日: | 2019-01-04 |
| 發明(設計)人: | 何金來;雷宇 | 申請(專利權)人: | 北京智能管家科技有限公司 |
| 主分類號: | G10L15/197 | 分類號: | G10L15/197;G10L15/26 |
| 代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 孟金喆 |
| 地址: | 101500 北京市密云區經濟開發*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 識別 方法 裝置 終端 計算機 可讀 存儲 介質 | ||
1.一種語音識別方法,其特征在于,包括:
根據采集到的語音的聲學特征,計算所述語音與解碼網絡中的音素序列的聲學相似概率;其中,所述解碼網絡包括多組音素序列,每一組音素序列對應一個預設的命令詞內容或對應噪音內容;
根據所述聲學相似概率,獲得所述語音與所述音素序列的匹配概率;
將所述語音識別為匹配概率最高的音素序列所對應的內容;
其中,所述根據采集到的語音的聲學特征,計算所述語音與解碼網絡中的音素序列的聲學相似概率,包括:
獲取預先訓練的解碼網絡中音素序列的聲學模型;其中,訓練噪音內容對應的聲學模型所采用的噪音樣本包括多個兩兩之間聲學特征差值大于預設的閾值的語音樣本;訓練命令詞對應的聲學模型所采用的命令詞樣本包括多個采用不同口音朗讀的命令詞語音樣本;
根據采集到的語音的聲學特征,采用所述聲學模型計算所述語音與解碼網絡中的音素序列的聲學相似概率。
2.如權利要求1所述的語音識別方法,其特征在于,所述解碼網絡是使用加權有限狀態轉換器構造的;
所述根據所述聲學相似概率,獲得所述語音與所述音素序列的匹配概率,具體包括:
計算所述聲學相似概率與所述音素序列的權重的和值,作為所述語音與所述音素序列的匹配概率。
3.如權利要求2所述的語音識別方法,其特征在于,還包括:
若確認采集到的語音為噪音,且將所述語音識別為預先設定的命令詞,則提高所述解碼網絡中噪音內容對應的音素序列的權重。
4.如權利要求1-3任一所述的語音識別方法,其特征在于,所述解碼網絡還包括與靜音內容對應的音素序列。
5.一種語音識別裝置,其特征在于,包括:
計算模塊,用于根據采集到的語音的聲學特征,計算所述語音與解碼網絡中的音素序列的聲學相似概率;其中,所述解碼網絡包括多組音素序列,每一組音素序列對應一個預設的命令詞內容或對應噪音內容;
匹配模塊,用于根據所述聲學相似概率,獲得所述語音與所述音素序列的匹配概率;
識別模塊,用于將所述語音識別為匹配概率最高的音素序列所對應的內容;
其中,所述計算模塊包括:
模型獲取單元,用于獲取預先訓練的解碼網絡中音素序列的聲學模型;其中,訓練噪音內容對應的聲學模型所采用的噪音樣本包括多個兩兩之間聲學特征差值大于預設的閾值的語音樣本;訓練命令詞對應的聲學模型所采用的命令詞樣本包括多個采用不同口音朗讀的命令詞語音樣本;
模型運算單元,用于根據采集到的語音的聲學特征,采用所述聲學模型計算所述語音與解碼網絡中的音素序列的聲學相似概率。
6.如權利要求5所述的語音識別裝置,其特征在于,所述解碼網絡是使用加權有限狀態轉換器構造的;
所述語音識別裝置還包括:
權重調整模塊,用于若確認采集到的語音為噪音,且將所述語音識別為預先設定的命令詞,則提高所述解碼網絡中噪音內容對應的音素序列的權重。
7.一種終端,其特征在于,所述終端包括:
一個或多個處理器;
存儲器,用于存儲一個或多個程序,
當所述一個或多個程序被所述一個或多個處理器執行,使得所述一個或多個處理器實現如權利要求1-4中任一所述的語音識別方法。
8.一種計算機可讀存儲介質,其上存儲有計算機程序,其特征在于,該程序被處理器執行時實現如權利要求1-4中任一所述的語音識別方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京智能管家科技有限公司,未經北京智能管家科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710964474.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:車內主動降噪系統
- 下一篇:用于檢測設備的新型語音電路





