[發明專利]語音識別方法及裝置有效
| 申請號: | 201710517737.4 | 申請日: | 2017-06-29 |
| 公開(公告)號: | CN108288468B | 公開(公告)日: | 2019-07-19 |
| 發明(設計)人: | 鄭平;饒豐;盧鯉;李濤 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G10L15/22 | 分類號: | G10L15/22;G10L15/10;G10L15/08;G10L15/28;G10L15/30 |
| 代理公司: | 北京三高永信知識產權代理有限責任公司 11138 | 代理人: | 朱雅男 |
| 地址: | 518057 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 候選識別 選擇規則 目標結果 選擇目標 語音識別 實時性 語音識別算法 計算機領域 語言模型 語音信號 困惑度 消耗 | ||
1.一種語音識別方法,其特征在于,所述方法包括:
獲取語音信號;
根據語音識別算法對所述語音信號進行識別,得到n個候選識別結果,所述候選識別結果是指所述語音信號對應的文本信息,所述n為大于1的整數;
根據m種選擇規則中執行順序為j的選擇規則確定所述n個候選識別結果中的目標結果,所述目標結果是指所述n個候選識別結果中與所述語音信號匹配度最高的候選識別結果,所述m為大于1的整數,所述j的初始值為1;
當根據所述執行順序為j的選擇規則未確定出所述目標結果時,根據執行順序為j+1的選擇規則確定所述n個候選識別結果中的所述目標結果。
2.根據權利要求1所述的方法,其特征在于,所述m種選擇規則的執行順序根據各自的算法復雜程度確定,所述執行順序與所述算法復雜程度呈正相關關系。
3.根據權利要求1所述的方法,其特征在于,所述m種選擇規則包括命令選擇規則、功能選擇規則和對話選擇規則中的至少兩種,所述命令選擇規則的算法復雜程度低于所述功能選擇規則的算法復雜程度,所述功能選擇規則的算法復雜程度低于所述對話選擇規則的算法復雜程度,
所述命令選擇規則用于指示語音識別設備根據命令詞庫中是否包括與第i個候選識別結果相匹配的命令關鍵詞來檢測所述第i個候選識別結果是否為所述目標結果,1≤i≤n;
所述功能選擇規則用于指示所述語音識別設備根據語音詞庫中是否包括與語音關鍵詞相匹配的詞庫關鍵詞來檢測所述第i個候選識別結果是否為所述目標結果,所述語音關鍵詞是所述第i個候選識別結果中的至少一個關鍵詞;
所述對話選擇規則用于指示所述語音識別設備根據訓練出的語言模型確定每個候選識別結果與所述語音信號的相似程度來選擇所述目標結果。
4.根據權利要求3所述的方法,其特征在于,根據所述命令選擇規則,確定所述n個候選識別結果中的目標結果,包括:
檢測所述命令詞庫的第一對應關系是否包括所述與第i個候選識別結果相匹配的命令關鍵詞,1≤i≤n;
在所述第一對應關系包括所述與第i個候選識別結果相匹配的命令關鍵詞時,確定所述第i個候選識別結果為所述目標結果;
其中,所述第一對應關系至少包括所述命令關鍵詞。
5.根據權利要求4所述的方法,其特征在于,所述檢測所述命令詞庫的第一對應關系是否包括所述與第i個候選識別結果相匹配的命令關鍵詞之后,還包括:
在所述第一對應關系不包括與所述n個候選識別結果中的任意一個候選識別結果相匹配的命令關鍵詞時,檢測所述命令詞庫中的第二對應關系是否包括與所述第i個候選識別結果中的任意一個字相匹配的關鍵字;
在所述第二對應關系包括與所述第i個候選識別結果中的字相匹配的關鍵字時,根據所述第二對應關系中所述關鍵字對應的索引值,在所述第一對應關系中查找所述索引值對應的命令關鍵詞;
確定所述第i個候選識別結果與所述命令關鍵詞之間的編輯距離,所述編輯距離用于指示所述第i個候選識別結果轉換為所述命令關鍵詞所需執行的操作次數;
在所述編輯距離小于預設數值時,確定所述第i個候選識別結果為所述目標結果;
其中,所述第一對應關系包括所述索引值與所述命令關鍵詞之間的對應關系,所述第二對應關系包括所述索引值與所述關鍵字之間的對應關系。
6.根據權利要求3所述的方法,其特征在于,根據所述功能選擇規則,選擇所述n個候選識別結果中的目標結果,包括:
分析第i個候選識別結果的功能模板,1≤i≤n;
檢測所述語音詞庫是否包括與所述第i個候選識別結果中的所述語音關鍵詞相匹配的所述詞庫關鍵詞;
在所述語音詞庫包括與所述第i個候選識別結果中的語音關鍵詞相匹配的所述詞庫關鍵詞時,將所述第i個候選識別結果確定為所述目標結果,所述語音關鍵詞是所述第i個候選識別結果中的至少一個關鍵詞;
其中,所述第i個候選識別結果包括所述功能模板和所述語音關鍵詞。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710517737.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種語音識別方法、裝置及語音識別引擎
- 下一篇:一種音箱及交互方法





