[發明專利]語音識別方法、裝置和系統及存儲介質在審
| 申請號: | 202011212947.0 | 申請日: | 2020-11-02 |
| 公開(公告)號: | CN112133294A | 公開(公告)日: | 2020-12-25 |
| 發明(設計)人: | 王杰;李秀林 | 申請(專利權)人: | 標貝(北京)科技有限公司 |
| 主分類號: | G10L15/06 | 分類號: | G10L15/06;G10L15/14;G10L15/26 |
| 代理公司: | 北京睿邦知識產權代理事務所(普通合伙) 11481 | 代理人: | 徐丁峰;戴亞南 |
| 地址: | 100192 北京市海淀區西小口路66號中關*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 識別 方法 裝置 系統 存儲 介質 | ||
1.一種語音識別方法,包括:
獲取待識別語音;
提取所述待識別語音的聲學特征;
將所述聲學特征輸入轉換器模型,以在第i個時間步獲得所述轉換器模型輸出的與第i個語音段相對應的模型分數集合,其中,所述待識別語音包括n個語音段,i=1,2,……,n,所述模型分數集合包括與所述轉換器模型所建模的文字集合中的所有文字一一對應的模型分數,每個模型分數表示所述第i個語音段屬于該模型分數所對應的文字的概率;
結合所述模型分數集合以及加權有限狀態機模塊,計算從第1個語音段至所述第i個語音段中的所有語音段所對應的至少一個轉移路徑各自的路徑分數;以及
基于所述至少一個轉移路徑各自的路徑分數,獲得與所述第i個語音段相對應的文字解碼結果。
2.根據權利要求1所述的語音識別方法,其中,所述將所述聲學特征輸入轉換器模型,以在第i個時間步獲得所述轉換器模型輸出的與第i個語音段相對應的模型分數集合包括:
將所述待識別語音的聲學特征輸入所述轉換器模型的編碼器模塊,以獲得所述編碼器模塊輸出的編碼結果;
在所述第i個時間步下,將在所述第i個語音段之前的所有語音段的文字解碼結果與所述編碼結果一起,輸入所述轉換器模型的解碼器模塊,以獲得所述解碼器模塊輸出的所述模型分數集合。
3.根據權利要求1所述的語音識別方法,其中,所述結合所述模型分數集合以及加權有限狀態機模塊,計算從第1個語音段至所述第i個語音段中的所有語音段所對應的轉移路徑各自的路徑分數包括:
從所述加權有限狀態機模塊中獲取所述第i個語音段所對應的轉移分數集合,所述轉移分數集合包括與從先前狀態轉移到當前狀態集合的所有轉移弧一一對應的轉移分數,其中,在i=1的情況下,所述先前狀態為起始狀態,并且在i>1的情況下,所述先前狀態為與第i-1個語音段的文字解碼結果相對應的狀態,所述當前狀態集合包括所述先前狀態鏈接到的所有當前狀態;
對于從所述起始狀態出發轉移至所述當前狀態集合的過程中經歷的所有轉移路徑中的任一當前轉移路徑,將先前轉移路徑的路徑分數、所述轉移分數集合中的與特定轉移弧相對應的轉移分數、以及所述模型分數集合中的與特定文字相對應的模型分數相加,以獲得所述當前轉移路徑的路徑分數,其中,所述當前轉移路徑包括所述先前轉移路徑和所述特定跳轉弧,所述先前轉移路徑是從所述起始狀態出發轉移至所述先前狀態的過程中經歷的轉移路徑,所述特定轉移弧是從所述先前狀態轉移至所述當前狀態集合中的當前狀態之一的轉移弧,所述特定文字是與所述特定轉移弧上的輸出標簽一致的文字;
其中,所述至少一個轉移路徑是從所述起始狀態出發轉移至所述當前狀態集合的過程中經歷的所有轉移路徑。
4.根據權利要求3所述的語音識別方法,其中,所述基于所述第1個語音段至所述第i個語音段中的所有語音段所對應的至少一個轉移路徑各自的路徑分數,獲得與所述第i個語音段相對應的文字解碼結果包括:
從所述至少一個轉移路徑中選擇路徑分數最高的轉移路徑;
確定所選擇的轉移路徑中包含的從所述先前狀態轉移至當前狀態的轉移弧上的輸出標簽為所述第i個語音段所對應的文字解碼結果。
5.根據權利要求1所述的語音識別方法,其中,在所述結合所述模型分數集合以及加權有限狀態機模塊,計算從第1個語音段至所述第i個語音段中的所有語音段所對應的至少一個轉移路徑各自的路徑分數之前,所述語音識別方法還包括:
接收用戶輸入的模型更新信息;以及
基于所述模型更新信息對所述加權有限狀態機模塊中的模型進行更新,其中,所述加權有限狀態機模塊包括聲學模型、發音詞典模型、語言模型、上下文相關音子模型中的一種或多種。
6.根據權利要求5所述的語音識別方法,其中,所述模型更新信息包括與新的轉移弧相關的轉移弧信息,所述轉移弧信息包括新的轉移弧上的輸入標簽、新的轉移弧上的輸出標簽和所述新的轉移弧的轉移分數,所述基于所述模型更新信息對所述加權有限狀態機模塊中的模型進行更新包括:
將所述新的轉移弧添加到所述加權有限狀態機模塊的對應模型中;或者,利用所述新的轉移弧替換所述加權有限狀態機模塊的對應模型中的對應轉移弧。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于標貝(北京)科技有限公司,未經標貝(北京)科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011212947.0/1.html,轉載請聲明來源鉆瓜專利網。





