[發明專利]一種語音識別方法、裝置和計算機可讀存儲介質有效

申請號：	201810600422.0	申請日：	2018-06-12
公開（公告）號：	CN110600011B	公開（公告）日：	2022-04-01
發明（設計）人：	高瑩瑩	申請（專利權）人：	中國移動通信有限公司研究院;中國移動通信集團有限公司
主分類號：	G10L15/06	分類號：	G10L15/06;G10L15/08;G10L15/10
代理公司：	北京派特恩知識產權代理有限公司 11270	代理人：	王姍姍;張穎玲
地址：	100053 北***	國省代碼：	北京;11
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	一種語音識別方法裝置計算機可讀存儲介質
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

本發明實施例提供了一種語音識別方法、裝置和計算機可讀存儲介質，所述方法包括：統計識別結果中每個詞語發生每種類型識別錯誤的次數；基于所述每個詞語發生每種類型識別錯誤的次數，確定該詞語以及該詞語構成的N元詞組的語言模型加權因子；基于所述語言模型加權因子，分別對該詞語的語言模型概率以及該詞語構成的N元詞組的語言模型概率進行調整，基于調整后的語言模型再次進行語音識別；所述N為大于1的正整數。

技術領域

本發明涉及移動通信技術領域，尤其涉及一種語音識別方法、裝置和計算機可讀存儲介質。

背景技術

語音識別的最終目標是把輸入的語音序列轉換為正確的漢字序列。在大詞匯量連續語音識別中，由于各種因素的影響，解碼輸出的識別假設中經常存在錯誤，阻礙了語音識別系統的應用。

對于識別結果的糾錯方法通常是基于某些轉換規則的，如在某些條件下將某些詞語修正為其他詞語，這類方法的難點在于如何提取或學習到有效并且魯棒的轉換規則，而不會在修正某些詞語的同時又引入了新的錯誤。

相關技術中提出了提高語音識別準確性的方法，但是也存在一定的局限性：

1)應用過程需要積累一定量的用戶語料并提供用戶文檔，在當前很多應用中不具備該條件；

2)按類別對加權因子進行調整的方式相對較粗，不能更有針對性的調整某些易錯易混詞；

3)未給出對于詞組語言模型概率調整的方法。

發明內容

有鑒于此，本發明實施例期望提供一種語音識別方法、裝置和計算機可讀存儲介質。

為達到上述目的，本發明實施例的技術方案是這樣實現的：

本發明實施例提供了一種語音識別方法，該方法包括：

統計識別結果中每個詞語發生每種類型識別錯誤的次數；

基于所述每個詞語發生每種類型識別錯誤的次數，確定該詞語以及該詞語構成的N元詞組的語言模型加權因子；

基于所述語言模型加權因子，分別對該詞語的語言模型概率以及該詞語構成的N元詞組的語言模型概率進行調整，基于調整后的語言模型再次進行語音識別；所述N為大于1的正整數。

其中，所述識別錯誤的類型包括：

替代型錯誤、刪除型錯誤和插入型錯誤。

其中，所述統計識別結果中每個詞語發生每種類型識別錯誤的次數，包括：

確定發生刪除型錯誤，則在標注文本中該錯誤位置對應詞語的刪除型錯誤次數D加1；在標注文本中與該詞語構成的N元詞組的D也加1；

確定發生插入型錯誤，則在識別文本中該錯誤位置對應詞語的插入型錯誤次數I加1；在識別文本中與該詞語構成的N元詞組的I也加1；

確定發生替代型錯誤，則在標注文本中該錯誤位置對應詞語的被其他詞語替代次數S_pas加1，在標注文本中與該詞語構成的N元詞組的S_pas也加1；在識別文本中該錯誤位置對應詞語替代目標詞語的次數S_act加1，在識別文本中與該詞語構成的N元詞組的S_act也加1。

其中，所述語言模型加權因子表示為：

R＝(S_pas+D)/(S_act+I)；

其中，所述R表示語言模型加權因子，所述D表示在識別結果中出現刪除型錯誤的次數，所述I表示插入型錯誤的次數，所述S_act表示替代目標詞語的次數，所述S_pas表示被其他詞語替代的次數。

其中，所述基于所述語言模型加權因子，分別對該詞語的語言模型概率以及該詞語構成的N元詞組的語言模型概率進行調整，包括：

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于中國移動通信有限公司研究院;中國移動通信集團有限公司，未經中國移動通信有限公司研究院;中國移動通信集團有限公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201810600422.0/2.html，轉載請聲明來源鉆瓜專利網。

上一篇：一種語料提取方法及裝置
下一篇：一種人工智能學習的模糊語音語義識別方法及系統

同類專利

專利分類

G 物理

G10 樂器；聲學
G10L 語音分析或合成；語音識別；音頻分析或處理
G10L15-00 語音識別
G10L15-02 .語音識別的特征提取；識別單位的選擇
G10L15-04 .分段或字極限檢測
G10L15-06 .創建基準模板；訓練語音識別系統，例如對說話者聲音特征的適應
G10L15-08 .語音分類或檢索
G10L15-20 .專門適用于不利環境

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產權局專利說明書；

2、支持發明專利、實用新型專利、外觀設計專利（升級中）；

3、專利數據每周兩次同步更新，支持Adobe PDF格式；

4、內容包括專利技術的結構示意圖、流程工藝圖或技術構造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】