[發明專利]一種語音識別方法及其相關產品在審
| 申請號: | 202210945100.6 | 申請日: | 2022-08-08 |
| 公開(公告)號: | CN115312041A | 公開(公告)日: | 2022-11-08 |
| 發明(設計)人: | 王孟之;萬根順;潘嘉;劉聰;胡國平;胡郁 | 申請(專利權)人: | 科大訊飛股份有限公司 |
| 主分類號: | G10L15/08 | 分類號: | G10L15/08;G10L15/02 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 史翠 |
| 地址: | 230088 安徽*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 語音 識別 方法 及其 相關 產品 | ||
1.一種語音識別方法,其特征在于,包括:
獲取語音數據以及熱詞庫;所述熱詞庫包括熱詞;
根據所述語音數據,確定所述語音數據的聲學特征;
基于所述熱詞庫中的熱詞和所述聲學特征,確定所述熱詞的整詞分數;
利用所述熱詞的整詞分數對所述語音數據進行熱詞激勵。
2.根據權利要求1所述的方法,其特征在于,所述基于所述熱詞庫中的熱詞和所述聲學特征,確定所述熱詞的整詞分數,包括:
根據所述熱詞對應的熱詞信息,確定所述熱詞的詞向量;
通過注意力機制,獲取所述聲學特征對應的第一聲學語義向量;
計算所述熱詞的詞向量和所述第一聲學語義向量之間的相似度,作為所述熱詞的整詞分數。
3.根據權利要求1所述的方法,其特征在于,所述方法通過語音識別模型實現;所述方法還包括:
獲取所述語音識別模型的基礎詞庫;所述基礎詞庫包括單字和/或子詞;
基于所述基礎詞庫中的單字和/或子詞,以及所述熱詞庫中的熱詞,構建新的詞庫;
基于所述新的詞庫對所述語音數據進行熱詞激勵。
4.根據權利要求3所述的方法,其特征在于,所述基于所述基礎詞庫中的單字和/或子詞,以及所述熱詞庫中的熱詞,構建新的詞庫,包括:
獲取所述單字和/或子詞的分數;
對所述單字和/或子詞的分數,以及所述熱詞的整詞分數進行拼接處理,生成所述新的詞庫;所述新的詞庫以所述單字和/或子詞,以及所述熱詞為元素構建。
5.根據權利要求3所述的方法,其特征在于,所述基于所述新的詞庫對所述語音數據進行熱詞激勵,包括:
將所述語音數據的解碼結果與所述新的詞庫進行匹配;
在所述新的詞庫中的熱詞與所述解碼結果的匹配度大于或等于預設匹配度時,基于所述新的詞庫中的元素的分數,對所述語音數據進行熱詞激勵。
6.根據權利要求1至5任一項所述的方法,其特征在于,所述方法還包括:
獲取用于語音識別的預設熱詞詞典;
確定所述預設熱詞詞典中每兩個預設熱詞之間的相似度,并按照從大到小的順序對所述每兩個預設熱詞之間的相似度進行排序;
基于排序結果,從所述預設熱詞詞典中確定每個預設熱詞的相似熱詞;
若所述熱詞庫和所述預設熱詞詞典中均存在所述語音數據對應的熱詞,則從所述語音數據對應的熱詞的相似熱詞中擇一加入所述熱詞庫。
7.根據權利要求1至5任一項所述的方法,其特征在于,所述方法還包括:
獲取所述語音數據在當前時刻之前的已解碼結果;
通過注意力機制,獲取所述已解碼結果對應的第二聲學語義向量;
對所述第二聲學語義向量進行分析,得到所述第二聲學語義向量的首個音節信息;
基于所述首個音節信息,從所述熱詞庫中刪除與所述首個音節信息不匹配的熱詞,并以刪除與所述首個音節信息不匹配的熱詞后的熱詞庫進行語音識別。
8.根據權利要求1至5任一項所述的方法,其特征在于,所述方法通過語音識別模型實現;所述方法還包括:
基于Softmax損失函數,確定目標函數;
利用所述目標函數對所述語音識別模型進行更新。
9.根據權利要求8所述的方法,其特征在于,所述基于Softmax損失函數,確定目標函數,包括:
確定所述語音識別模型的訓練樣本的數量;所述訓練樣本包括所述熱詞庫中的熱詞;
根據所述訓練樣本的數量和所述熱詞庫中的熱詞的整詞分數,計算所述Softmax損失函數,并以所述Softmax損失函數作為所述目標函數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于科大訊飛股份有限公司,未經科大訊飛股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210945100.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:貼裝設備
- 下一篇:一種風刀組件及風刀裝置





