[發明專利]語音識別方法、裝置、設備及存儲介質在審
| 申請號: | 202210834523.0 | 申請日: | 2022-07-14 |
| 公開(公告)號: | CN115206301A | 公開(公告)日: | 2022-10-18 |
| 發明(設計)人: | 莊子揚;魏韜;馬駿;王少軍 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G10L15/08 | 分類號: | G10L15/08;G10L15/22;G10L15/26 |
| 代理公司: | 深圳市世聯合知識產權代理有限公司 44385 | 代理人: | 郝少劍 |
| 地址: | 518000 廣東省深圳市福田區福*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 識別 方法 裝置 設備 存儲 介質 | ||
本申請涉及人工智能技術,揭露了一種語音識別方法、裝置、設備及存儲介質,所述方法包括:將語音數據分幀輸入ASR模型,得到多個候選字及其聲學概率;通過對當前幀對應的候選字及其聲學概率進行束搜索,得到當前幀對應的第一目標候選字;判斷第一目標候選字與熱詞圖中的熱詞是否匹配;若匹配,從熱詞圖中確定下一幀的備選字,當下一幀的候選字中包括備選字,將備選字作為第二目標候選字;若不匹配,則通過束搜索確定下一幀的第二目標候選字,直至各幀對應的目標候選字都確定完畢;基于各目標候選字,得到多個語句組合及其聲學得分,并利用語句組合搜索熱詞圖,獲取熱詞得分;基于聲學得分和熱詞得分,確定識別結果。本申請提高了語音識別的準確度。
技術領域
本申請涉及人工智能技術領域,尤其涉及一種語音識別方法、裝置、設備及存儲介質。
背景技術
隨著社會和技術的不斷發展,語音識別技術的應用越來越普遍,在現有的語音識別的應用中,對于常用的詞匯識別效果較好,但是對于一些特有的人名、歌名、地名或者某個領域的專有詞匯,例如人名“宋xx”、歌名“國際歌”、地名“麗澤商務區”以及語音識別專業詞匯“解碼器”等,存在識別準確率不高的情況。針對這一情況,現有技術常通過添加熱詞進行識別特有名詞,但僅通過熱詞進行特有名詞的匹配識別,識別準確率依舊不高。因此,如何解決語音識別準確率較低的問題成為了亟待解決的問題。
發明內容
本申請提供了一種語音識別方法、裝置、設備及存儲介質,以解決現有語音識別準確率較低的問題。
為解決上述問題,本申請提供了一種語音識別方法,包括:
將語音數據分幀輸入ASR模型進行識別處理,得到多個候選字及其對應的聲學概率;
通過對當前幀對應的所述候選字及其聲學概率進行束搜索,得到所述當前幀對應的第一目標候選字;
判斷所述第一目標候選字與熱詞圖中的熱詞是否匹配,其中,所述熱詞圖基于預設熱詞表構建得到;
若匹配,則基于所述第一目標候選字,從所述熱詞圖中確定下一幀的備選字,當所述下一幀的候選字中包括所述備選字,則將所述備選字作為第二目標候選字;
若不匹配,則基于下一幀中候選字對應的聲學概率確定第二目標候選字,直至各幀對應的目標候選字都確定完畢;
基于各幀對應的所述目標候選字,得到多個語句組合及其對應的聲學得分,并利用所述語句組合搜索熱詞圖,獲取熱詞得分;
基于所述聲學得分和熱詞得分,確定識別結果。
進一步的,所述熱詞圖基于預設熱詞表構建得到包括:
對所述預設熱詞表中的熱詞進行拆分,得到待處理字;
根據各熱詞對應的字數,從大到小依次利用對應的所述待處理字構建所述熱詞圖中連接各節點的弧線,并設定了對應的弧權重,其中,所述待處理字與弧線一一對應,熱詞對應的多個待處理字在所述熱詞圖中形成閉環。
進一步的,所述設定了對應的弧權重之后,還包括:
在所述熱詞圖的各節點上設置有回退弧,所述回退弧為連接各節點與初始節點的弧線,并且所述回退弧對應的權重為各所述節點已有權重的相反數;
當在后構建的熱詞為在先已構建完成熱詞的前綴時,對所述已構建完成熱詞的前綴對應節點的回退弧權重進行置零處理。
進一步的,所述基于各幀對應的目標候選字,得到多個語句組合及其對應的聲學得分包括:
基于各幀對應的所述目標候選字,確定多個所述語句組合;
根據所述語句組合中包含的所述目標候選字,獲取所述目標候選字對應的聲學概率;
將所述目標候選字對應的聲學概率相乘得到所述聲學得分。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210834523.0/2.html,轉載請聲明來源鉆瓜專利網。





