[發明專利]一種語音識別方法及其相關產品在審
| 申請號: | 202210945100.6 | 申請日: | 2022-08-08 |
| 公開(公告)號: | CN115312041A | 公開(公告)日: | 2022-11-08 |
| 發明(設計)人: | 王孟之;萬根順;潘嘉;劉聰;胡國平;胡郁 | 申請(專利權)人: | 科大訊飛股份有限公司 |
| 主分類號: | G10L15/08 | 分類號: | G10L15/08;G10L15/02 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 史翠 |
| 地址: | 230088 安徽*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 語音 識別 方法 及其 相關 產品 | ||
本申請公開了一種語音識別方法及相關產品,該方法可以包括:獲取語音數據以及熱詞庫;熱詞庫包括熱詞;根據語音數據,確定語音數據的聲學特征;基于熱詞庫中的熱詞和聲學特征,確定熱詞的整詞分數;利用熱詞的整詞分數對語音數據進行熱詞激勵。通過確定熱詞庫中的熱詞的整詞分數,在進行熱詞激勵時,可以直接按照整詞分數進行熱詞激勵,因此,可以避免按照單字或子詞的分數逐一進行激勵而導致的整詞激勵失敗的問題,從而提高熱詞語音識別的準確率。
技術領域
本申請涉及語音處理技術領域,尤其涉及一種語音識別方法及其相關產品。
背景技術
目前,語音識別技術已逐漸成為人機交互的重要途徑,在智能移動設備、智能客服、智能家居等領域得到了廣泛的應用。在實際應用時,由于不同用戶在年齡、職業、社交網絡、興趣愛好等多方面存在差異,并且新的熱點話題和相應的熱點詞匯層出不窮,因此,在語音識別場景中經常會出現一些具有用戶特性和時效性的詞語,這些詞語被稱為“熱詞”。
基于上述針對熱詞的語音識別需求,已有的語音識別模型通常會采用語音數據進行熱詞激勵的方式實現識別,即如果語音數據的解碼結果與預先設置的熱詞匹配,則對該熱詞的分數進行激勵,以增大熱詞的輸出概率,從而使該熱詞出現在最優輸出路徑中。但是,熱詞激勵的過程需要按照熱詞中的單字或子詞的分數逐一激勵,在這種情況下,如果某個單字或子詞激勵失敗,或者,對首個單字或子詞解碼后就停止解碼而導致激勵中斷,那么會出現整詞激勵失敗的問題。因此,一旦上述按照熱詞的單字或子詞的分數逐一進行熱詞激勵的方式出現問題,就會導致熱詞的語音識別的準確率不足。
發明內容
本申請實施例提供了一種語音識別方法及其相關產品,以提高熱詞的語音識別的準確率。
第一方面,本申請實施例提供了一種語音識別方法,包括:
獲取語音數據以及熱詞庫;所述熱詞庫包括熱詞;
根據所述語音數據,確定所述語音數據的聲學特征;
基于所述熱詞庫中的熱詞和所述聲學特征,確定所述熱詞的整詞分數;
利用所述熱詞的整詞分數對所述語音數據進行熱詞激勵。
可選地,所述基于所述熱詞庫中的熱詞和所述聲學特征,確定所述熱詞的整詞分數,包括:
根據所述熱詞對應的熱詞信息,確定所述熱詞的詞向量;
通過注意力機制,獲取所述聲學特征對應的第一聲學語義向量;
計算所述熱詞的詞向量和所述第一聲學語義向量之間的相似度,作為所述熱詞的整詞分數。
可選地,所述方法通過語音識別模型實現;所述方法還包括:
獲取所述語音識別模型的基礎詞庫;所述基礎詞庫包括單字和/或子詞;
基于所述基礎詞庫中的單字和/或子詞,以及所述熱詞庫中的熱詞,構建新的詞庫;
基于所述新的詞庫對所述語音數據進行熱詞激勵。
可選地,所述基于所述基礎詞庫中的單字和/或子詞,以及所述熱詞庫中的熱詞,構建新的詞庫,包括:
獲取所述單字和/或子詞的分數;
對所述單字和/或子詞的分數,以及所述熱詞的整詞分數進行拼接處理,生成所述新的詞庫;所述新的詞庫以所述單字和/或子詞,以及所述熱詞為元素構建。
可選地,所述基于所述新的詞庫對所述語音數據進行熱詞激勵,包括:
將所述語音數據的解碼結果與所述新的詞庫進行匹配;
在所述新的詞庫中的熱詞與所述解碼結果的匹配度大于或等于預設匹配度時,基于所述新的詞庫中的元素的分數,對所述語音數據進行熱詞激勵。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于科大訊飛股份有限公司,未經科大訊飛股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210945100.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:貼裝設備
- 下一篇:一種風刀組件及風刀裝置





