[發明專利]語音識別方法及裝置有效
| 申請號: | 201710517737.4 | 申請日: | 2017-06-29 |
| 公開(公告)號: | CN108288468B | 公開(公告)日: | 2019-07-19 |
| 發明(設計)人: | 鄭平;饒豐;盧鯉;李濤 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G10L15/22 | 分類號: | G10L15/22;G10L15/10;G10L15/08;G10L15/28;G10L15/30 |
| 代理公司: | 北京三高永信知識產權代理有限責任公司 11138 | 代理人: | 朱雅男 |
| 地址: | 518057 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 候選識別 選擇規則 目標結果 選擇目標 語音識別 實時性 語音識別算法 計算機領域 語言模型 語音信號 困惑度 消耗 | ||
本發明公開了一種語音識別方法及裝置,屬于計算機領域。該方法包括:獲取語音信號;根據語音識別算法對所述語音信號進行識別,得到n個候選識別結果;根據m種選擇規則中執行順序為j的選擇規則確定所述n個候選識別結果中的目標結果;當根據所述執行順序為j的選擇規則未確定出所述目標結果時,根據執行順序為j+1的選擇規則確定所述n個候選識別結果中的所述目標結果;解決了根據RNN語言模型計算困惑度消耗的時間較長,導致從多個候選識別結果中選擇目標結果的實時性較差的問題;提高了從n個候選識別結果中選擇目標結果的實時性。
技術領域
本發明實施例涉及計算機領域,特別涉及一種語音識別方法及裝置。
背景技術
語音識別技術是指通過語音識別設備將語音信息識別為文本信息的技術,語音識別技術廣泛應用于語音撥號、語音導航、智能家居控制、語音搜索、聽寫數據錄入等場景。由于同一發音的語音信號可能對應多組不同字的組合,比如:nihao對應“你好”、“擬好”、“倪浩”這三種組合,因此,語音識別設備根據語音信號可能識別出多個候選識別結果。當語音識別設備識別出多個候選識別結果時,如何選擇出與語音信號匹配度最高的候選識別結果顯得尤為重要。
在一種典型的語音識別方法中,語音識別設備獲取到n個候選識別結果后,根據循環神經網絡(Recurrent Neural Network,RNN)語言模型,計算每個候選識別結果的困惑度,將困惑度的最小值對應的候選識別結果確定為目標結果。其中,RNN語言模型是根據一個通用的語料庫訓練得到的,困惑度用于指示候選識別結果與語音信號的相似程度,且困惑度與該相似程度呈負相關關系;目標結果是指n個候選識別結果中與實際接收到的語音信號匹配度最大的候選識別結果,n為大于1的整數。
由于根據RNN語言模型計算困惑度消耗的時間較長,因此,從n個候選識別結果中選擇目標結果的實時性較差。
發明內容
為了解決由于語音識別設備根據RNN語言模型計算困惑度消耗的時間較長,導致的從多個候選識別結果中選擇目標結果的實時性較差的問題,本發明實施例提供了一種語音識別方法及裝置。所述技術方案如下:
第一方面,提供了一種語音識別方法,所述方法包括:
獲取語音信號;
根據語音識別算法對所述語音信號進行識別,得到n個候選識別結果,所述候選識別結果是指所述語音信號對應的文本信息,所述n為大于1的整數;
根據m種選擇規則中執行順序為j的選擇規則確定所述n個候選識別結果中的目標結果,所述目標結果是指所述n個候選識別結果中與所述語音信號匹配度最高的候選識別結果,所述m為大于1的整數,所述j的初始值為1;
當根據所述執行順序為j的選擇規則未確定出所述目標結果時,根據執行順序為j+1的選擇規則確定所述n個候選識別結果中的所述目標結果。
第二方面,提供了一種候選識別結果選擇裝置,所述裝置包括:
信號獲取模塊,用于獲取語音信號;
語音識別模塊,用于根據語音識別算法對所述信號獲取模塊獲取到的所述語音信號進行識別,得到n個候選識別結果,所述候選識別結果是指所述語音信號對應的文本信息,所述n為大于1的整數;
第一確定模塊,用于根據m種選擇規則中執行順序為j的選擇規則確定所述語音識別模塊識別出的所述n個候選識別結果中的目標結果,所述目標結果是指所述n個候選識別結果中與所述語音信號匹配度最高的候選識別結果,所述m為大于1的整數,所述j的初始值為1;
第二確定模塊,用于當所述第一確定模塊根據所述執行順序為j的選擇規則未確定出所述目標結果時,根據執行順序為j+1的選擇規則確定所述n個候選識別結果中的所述目標結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710517737.4/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種語音識別方法、裝置及語音識別引擎
- 下一篇:一種音箱及交互方法





