[發明專利]一種語音識別方法、裝置和計算機可讀存儲介質有效
| 申請號: | 201810600422.0 | 申請日: | 2018-06-12 |
| 公開(公告)號: | CN110600011B | 公開(公告)日: | 2022-04-01 |
| 發明(設計)人: | 高瑩瑩 | 申請(專利權)人: | 中國移動通信有限公司研究院;中國移動通信集團有限公司 |
| 主分類號: | G10L15/06 | 分類號: | G10L15/06;G10L15/08;G10L15/10 |
| 代理公司: | 北京派特恩知識產權代理有限公司 11270 | 代理人: | 王姍姍;張穎玲 |
| 地址: | 100053 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 語音 識別 方法 裝置 計算機 可讀 存儲 介質 | ||
本發明實施例提供了一種語音識別方法、裝置和計算機可讀存儲介質,所述方法包括:統計識別結果中每個詞語發生每種類型識別錯誤的次數;基于所述每個詞語發生每種類型識別錯誤的次數,確定該詞語以及該詞語構成的N元詞組的語言模型加權因子;基于所述語言模型加權因子,分別對該詞語的語言模型概率以及該詞語構成的N元詞組的語言模型概率進行調整,基于調整后的語言模型再次進行語音識別;所述N為大于1的正整數。
技術領域
本發明涉及移動通信技術領域,尤其涉及一種語音識別方法、裝置和計算機可讀存儲介質。
背景技術
語音識別的最終目標是把輸入的語音序列轉換為正確的漢字序列。在大詞匯量連續語音識別中,由于各種因素的影響,解碼輸出的識別假設中經常存在錯誤,阻礙了語音識別系統的應用。
對于識別結果的糾錯方法通常是基于某些轉換規則的,如在某些條件下將某些詞語修正為其他詞語,這類方法的難點在于如何提取或學習到有效并且魯棒的轉換規則,而不會在修正某些詞語的同時又引入了新的錯誤。
相關技術中提出了提高語音識別準確性的方法,但是也存在一定的局限性:
1)應用過程需要積累一定量的用戶語料并提供用戶文檔,在當前很多應用中不具備該條件;
2)按類別對加權因子進行調整的方式相對較粗,不能更有針對性的調整某些易錯易混詞;
3)未給出對于詞組語言模型概率調整的方法。
發明內容
有鑒于此,本發明實施例期望提供一種語音識別方法、裝置和計算機可讀存儲介質。
為達到上述目的,本發明實施例的技術方案是這樣實現的:
本發明實施例提供了一種語音識別方法,該方法包括:
統計識別結果中每個詞語發生每種類型識別錯誤的次數;
基于所述每個詞語發生每種類型識別錯誤的次數,確定該詞語以及該詞語構成的N元詞組的語言模型加權因子;
基于所述語言模型加權因子,分別對該詞語的語言模型概率以及該詞語構成的N元詞組的語言模型概率進行調整,基于調整后的語言模型再次進行語音識別;所述N為大于1的正整數。
其中,所述識別錯誤的類型包括:
替代型錯誤、刪除型錯誤和插入型錯誤。
其中,所述統計識別結果中每個詞語發生每種類型識別錯誤的次數,包括:
確定發生刪除型錯誤,則在標注文本中該錯誤位置對應詞語的刪除型錯誤次數D加1;在標注文本中與該詞語構成的N元詞組的D也加1;
確定發生插入型錯誤,則在識別文本中該錯誤位置對應詞語的插入型錯誤次數I加1;在識別文本中與該詞語構成的N元詞組的I也加1;
確定發生替代型錯誤,則在標注文本中該錯誤位置對應詞語的被其他詞語替代次數S_pas加1,在標注文本中與該詞語構成的N元詞組的S_pas也加1;在識別文本中該錯誤位置對應詞語替代目標詞語的次數S_act加1,在識別文本中與該詞語構成的N元詞組的S_act也加1。
其中,所述語言模型加權因子表示為:
R=(S_pas+D)/(S_act+I);
其中,所述R表示語言模型加權因子,所述D表示在識別結果中出現刪除型錯誤的次數,所述I表示插入型錯誤的次數,所述S_act表示替代目標詞語的次數,所述S_pas表示被其他詞語替代的次數。
其中,所述基于所述語言模型加權因子,分別對該詞語的語言模型概率以及該詞語構成的N元詞組的語言模型概率進行調整,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國移動通信有限公司研究院;中國移動通信集團有限公司,未經中國移動通信有限公司研究院;中國移動通信集團有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810600422.0/2.html,轉載請聲明來源鉆瓜專利網。





