[發明專利]語音識別方法、裝置、計算機設備及存儲介質在審
| 申請號: | 202211021458.6 | 申請日: | 2022-08-24 |
| 公開(公告)號: | CN116129883A | 公開(公告)日: | 2023-05-16 |
| 發明(設計)人: | 喬宏利;蔣寧;吳海英;劉敏 | 申請(專利權)人: | 馬上消費金融股份有限公司 |
| 主分類號: | G10L15/04 | 分類號: | G10L15/04;G10L15/08;G10L15/26;G10L15/02 |
| 代理公司: | 北京同立鈞成知識產權代理有限公司 11205 | 代理人: | 郭曉龍;黃健 |
| 地址: | 401121 重慶市渝北區*** | 國省代碼: | 重慶;50 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 識別 方法 裝置 計算機 設備 存儲 介質 | ||
1.一種語音識別方法,其特征在于,所述方法包括:
獲取待識別的語音數據,所述語音數據包括按序的多個音頻時間片段;
將所述語音數據輸入語音識別模型進行語音識別處理,得到語音識別結果,所述語音識別結果用于表征所述語音數據中的每個音頻時間片段對應的拼音音節的分類結果;
根據拼音音節掩碼表和所述語音識別結果中每個音頻時間片段對應的拼音音節的分類結果,生成所述語音數據對應的拼音序列;
對所述拼音序列進行轉譯,生成所述語音數據對應的文字識別結果。
2.根據權利要求1所述的方法,其特征在于,所述語音識別模型包括預訓練層、循環層和分類層;所述預訓練層與所述循環層相連接,所述循環層與所述分類層相連接;
所述將所述語音數據輸入語音識別模型進行語音識別處理,得到語音識別結果,包括:
通過所述語音識別模型的所述預訓練層提取所述語音數據中每個音頻時間片段的語音特征,并對所述每個音頻時間片段的語音特征進行編碼處理,生成第一特征集;
通過所述循環層對所述第一特征集中的各個語音特征進行上下文學習,生成第二特征集;
利用所述分類層根據所述第二特征集,預測所述語音數據中的每個音頻時間片段對應的拼音音節的分類結果。
3.根據權利要求1所述的方法,其特征在于,所述根據拼音音節掩碼表和所述語音識別結果中每個音頻時間片段對應的拼音音節的分類結果,生成所述語音數據對應的拼音序列,包括:
根據所述每個音頻時間片段對應的拼音音節的分類結果和所述拼音音節掩碼表,依次確定所述每個音頻時間片段對應的前綴字符串集合;
根據所述語音數據中最后一個音頻時間片段對應的前綴字符串集合,確定所述語音數據對應的拼音序列。
4.根據權利要求3所述的方法,其特征在于,所述根據所述拼音音節的分類結果和所述拼音音節掩碼表,依次確定所述每個音頻時間片段對應的前綴字符串集合,包括:
依次遍歷多個音頻時間片段;
若當前遍歷的音頻時間片段為所述多個音頻時間片段中的第一個音頻時間片段,則根據所述當前遍歷的音頻時間片段對應的拼音音節的分類結果,對使用所述拼音音節掩碼表生成的全掩碼字符串進行擴展,確定所述當前遍歷的音頻時間片段對應的前綴字符串集合;
若當前遍歷的音頻時間片段不為所述多個音頻時間片段中的第一個音頻時間片段,則根據當前遍歷的音頻時間片段的前一個音頻時間片段對應的前綴字符串集合中每一個前綴字符串的目標概率,從所述前一個音頻時間片段對應的前綴字符串集合中,選擇出預設數量的目標字符串;
根據當前遍歷的音頻時間片段對應的拼音音節的分類結果和所述拼音音節掩碼表,對所述目標字符串進行擴展,確定所述當前遍歷的音頻時間片段對應的前綴字符串集合。
5.根據權利要求4所述的方法,其特征在于,所述預設數量與預設的前綴搜索寬度對應;任意一個前綴字符串的目標概率是指所述任意一個前綴字符串的結尾字符為空字符的概率,或者,任意一個前綴字符串的目標概率為所述任意一個前綴字符串的結尾字符為非空字符的概率。
6.根據權利要求4所述的方法,其特征在于,所述根據所述語音數據中最后一個音頻時間片段對應的前綴字符串集合,確定所述語音數據對應的拼音序列,包括:
從所述最后一個音頻時間片段對應的前綴字符集合中獲取目標概率最大的前綴字符串;
確定所述目標概率最大的前綴字符串對應的拼音序列;
在所述目標概率最大的前綴字符串對應的拼音序列中的韻母音節后添加空音節,生成所述語音數據對應的拼音序列。
7.根據權利要求1所述的方法,其特征在于,在所述根據拼音音節掩碼表和所述語音識別結果中每個音頻時間片段對應的拼音音節的分類結果,生成所述語音數據對應的拼音序列之前,所述方法還包括:
根據漢語拼音的規則信息和所述漢語拼音包含的拼音音節,生成所述拼音音節掩碼表。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于馬上消費金融股份有限公司,未經馬上消費金融股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211021458.6/1.html,轉載請聲明來源鉆瓜專利網。





