[發明專利]語音識別方法、裝置、介質及設備有效
| 申請號: | 202110735672.7 | 申請日: | 2021-06-30 |
| 公開(公告)號: | CN113470619B | 公開(公告)日: | 2023-08-18 |
| 發明(設計)人: | 董林昊;韓明倫;馬澤君 | 申請(專利權)人: | 北京有竹居網絡技術有限公司 |
| 主分類號: | G10L15/02 | 分類號: | G10L15/02;G10L15/06;G10L15/26 |
| 代理公司: | 北京英創嘉友知識產權代理事務所(普通合伙) 11447 | 代理人: | 曹寒梅 |
| 地址: | 101299 北京市平*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 識別 方法 裝置 介質 設備 | ||
本公開涉及一種語音識別方法、裝置、介質及設備,所述方法包括:接收待識別語音數據;根據所述待識別語音數據、熱詞信息和語音識別模型,獲得所述待識別語音數據對應的目標文本;其中,所述熱詞信息包含多個熱詞對應的文本序列和音標序列;所述語音識別模型包括語音識別子模型和語境識別子模型,所述語境識別子模型是基于訓練詞語以及所述訓練詞語的音標序列、文本序列以及訓練標簽進行訓練的。由此,在語境識別子模型進行訓練時是結合訓練數據的發音特征和文本特征進行訓練的,可以基于該發音特征對拼寫或發音相近的各個熱詞進行準確區分,因此對熱詞進行識別時,避免對熱詞的混淆識別,進一步提高語音識別的準確性。
技術領域
本公開涉及計算機技術領域,具體地,涉及一種語音識別方法、裝置、介質及設備。
背景技術
隨著深度學習的興起,各種完全依賴于神經網絡進行端到端建模的方法逐漸興起,逐步發展為自動語音識別(ASR)技術中的主流。通過自動語音識別,可直接將原始的語音數據轉換為對應的文本結果。相關技術中通常采用基于熱詞的先驗語境知識進行語音識別的方式提高語音識別的準確性。然而相關技術中采用熱詞先驗語境知識時,容易出現對拼寫或發音相近的熱詞的混淆識別,從而導致語音識別的準確度不足。
發明內容
提供該發明內容部分以便以簡要的形式介紹構思,這些構思將在后面的具體實施方式部分被詳細描述。該發明內容部分并不旨在標識要求保護的技術方案的關鍵特征或必要特征,也不旨在用于限制所要求的保護的技術方案的范圍。
第一方面,本公開提供一種語音識別方法,所述方法包括:
接收待識別語音數據;
根據所述待識別語音數據、熱詞信息和語音識別模型,獲得所述待識別語音數據對應的目標文本;其中,所述熱詞信息包含多個熱詞對應的文本序列和音標序列;所述語音識別模型包括語音識別子模型和語境識別子模型,所述語境識別子模型是基于訓練詞語以及所述訓練詞語的音標序列、文本序列以及訓練標簽進行訓練的。
可選地,所述語境識別子模型包括發音特征編碼器、文本特征編碼器、注意力模塊和語境特征解碼器;
所述根據所述待識別語音數據、熱詞信息和語音識別模型,獲得所述待識別語音數據對應的目標文本,包括:
根據所述發音特征編碼器對所述熱詞的音標序列進行編碼,獲得所述熱詞的發音特征向量,并根據所述文本特征編碼器對所述熱詞的文本序列進行編碼,獲得所述熱詞的文本特征向量;
根據所述語音識別子模型和所述待識別語音數據,獲得所述待識別語音數據對應的每一預測字符的字符聲學向量和文本概率分布;
根據所述注意力模塊、所述發音特征向量、所述文本特征向量以及所述字符聲學向量,獲得每一所述預測字符的語境特征向量;
根據所述語境特征解碼器和所述語境特征向量,獲得每一所述預測字符的語境概率分布;
根據所述文本概率分布和所述語境概率分布,確定所述待識別數據對應的目標文本。
可選地,所述根據所述注意力模塊、所述發音特征向量、所述文本特征向量以及所述字符聲學向量,獲得每一所述預測字符的語境特征向量,包括:
針對每一所述熱詞,根據該熱詞的所述發音特征向量和所述文本特征向量,確定該熱詞對應的融合特征向量;
針對每一所述預測字符,在所述注意力模塊中,根據所述預測字符的字符聲學向量、各個所述熱詞對應的融合特征向量和文本特征向量,確定所述預測字符對應的語境特征向量。
可選地,所述根據所述預測字符的字符聲學向量、各個所述熱詞對應的融合特征向量和文本特征向量,確定所述預測字符對應的語境特征向量,包括:
將所述字符聲學向量與每一所述熱詞對應的融合特征向量的點積,確定為該熱詞對應的初始權重;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京有竹居網絡技術有限公司,未經北京有竹居網絡技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110735672.7/2.html,轉載請聲明來源鉆瓜專利網。





