[發明專利]語音識別方法、裝置、設備及存儲介質在審
| 申請號: | 202110310488.8 | 申請日: | 2021-03-23 |
| 公開(公告)號: | CN112927695A | 公開(公告)日: | 2021-06-08 |
| 發明(設計)人: | 李潔瓊;邵鵬;應臻奕;李國慶 | 申請(專利權)人: | 上海仙塔智能科技有限公司;上海仙豆智能機器人有限公司 |
| 主分類號: | G10L15/22 | 分類號: | G10L15/22;G10L15/26;G10L15/06 |
| 代理公司: | 北京超凡宏宇專利代理事務所(特殊普通合伙) 11463 | 代理人: | 余菲 |
| 地址: | 200050 上海市長寧區長*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 識別 方法 裝置 設備 存儲 介質 | ||
1.一種語音識別方法,其特征在于,所述方法包括:
獲取輸入語音;
基于聲學模型和第一語言模型對所述輸入語音進行解碼,得到所述輸入語音的第一識別文本;
對所述輸入語音的第一識別文本進行話術分類,以標記出所述輸入語音的第一識別文本的類別標簽;
根據所述第一識別文本的類別標簽選擇第二語言模型,所述第二語言模型根據所述第一識別文本的類別標簽對應的訓練樣本得到;
根據所述第二語言模型對所述輸入語音進行解碼,以得到所述輸入語音的第二識別文本。
2.如權利要求1所述的方法,其特征在于,所述基于聲學模型和第一語言模型對所述輸入語音進行解碼,得到所述輸入語音的第一識別文本,包括:
獲取發音詞典和詞表中的音素列表;
根據所述發音詞典、所述詞表中的音素列表、所述聲學模型和所述第一語言模型生成解碼網絡;
將所述輸入語音作為所述解碼網絡的輸入,以使得所述解碼網絡對所述輸入語音進行解碼并輸出所述輸入語音的最優路徑,所述輸入語音的最優路徑由若干個詞語組成;
將所述輸入語音的最優路徑作為所述輸入語音的第一識別文本。
3.如權利要求1所述的方法,其特征在于,所述對所述輸入語音的第一識別文本進行話術分類,以標記出所述輸入語音的第一識別文本的類別標簽,包括:
將所述輸入語音的第一識別文本作為預先訓練得到的話術分類模型的輸入,使得所述話術分類模型輸出所述第一識別文本的若干種標簽概率;
根據所述若干種標簽概率將概率最高的標簽作為所述輸入語音的第一識別文本的類別標簽。
4.如權利要求3所述的方法,其特征在于,在所述將所述輸入語音的第一識別文本作為預先訓練得到的話術分類模型的輸入,使得所述話術分類模型輸出所述第一識別文本的若干種標簽概率之前,所述方法還包括:
獲取訓練集,所述訓練集包括若干訓練文本;
根據訓練算法訓練所述訓練集中的所述若干訓練文本,并得到所述話術分類模型,所述訓練算法為深度學習算法。
5.如權利要求1所述的方法,其特征在于,所述輸入語音的第一識別文本的類別標簽為導航標簽、媒體標簽、通話標簽中的一種或幾種的組合,所述第二語言模型包括導航類語言模型、媒體類語言模型、通話類語言模型中的一種或幾種的組合。
6.如權利要求5所述的方法,其特征在于,在所述根據所述第一識別文本的類別標簽選擇第二語言模型之前,所述方法還包括:
獲取導航類訓練集、媒體類訓練集、通話類訓練集;
依次根據所述導航類訓練集、所述媒體類訓練集、所述通話類訓練集訓練得到所述導航類語言模型、所述媒體類語言模型、所述通話類語言模型。
7.如權利要求1所述的方法,其特征在于,還包括:
當所述第一識別文本的類別標簽不存在關聯的所述第二語言模型時,根據所述第一語言模型對所述第一識別文本重新解碼,以使得所述第一語言模型輸出所述輸入語音的第二識別文本。
8.一種語音識別裝置,其特征在于,所述裝置包括:
獲取模塊,用于獲取輸入語音;
第一解碼模塊,用于基于聲學模型和第一語言模型對所述輸入語音進行解碼,得到所述輸入語音的第一識別文本;
話術分類模塊,用于對所述輸入語音的第一識別文本進行話術分類,以標記出所述輸入語音的第一識別文本的類別標簽;
選擇模塊,用于根據所述第一識別文本的類別標簽選擇第二語言模型,所述第二語言模型根據所述第一識別文本的類別標簽對應的訓練樣本得到;
第二解碼模塊,用于根據所述第二語言模型對所述輸入語音進行解碼,以得到所述輸入語音的第二識別文本。
9.一種語音識別設備,其特征在于,所述語音識別設備包括:
處理器;以及
存儲器,配置用于存儲機器可讀指令,所述指令在由所述處理器執行時,使得所述處理器執行如權利要求1-7任一項所述的語音識別方法。
10.一種存儲介質,其特征在于,所述存儲介質存儲有計算機程序,所述計算機程序被處理器執行如權利要求1-7任一項所述的語音識別方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海仙塔智能科技有限公司;上海仙豆智能機器人有限公司,未經上海仙塔智能科技有限公司;上海仙豆智能機器人有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110310488.8/1.html,轉載請聲明來源鉆瓜專利網。





