[發明專利]一種語音識別的方法和裝置有效

申請號：	201710065885.7	申請日：	2017-02-06
公開（公告）號：	CN108399914B	公開（公告）日：	2021-06-22
發明（設計）人：	徐禮逵	申請（專利權）人：	北京搜狗科技發展有限公司
主分類號：	G10L15/06	分類號：	G10L15/06;G10L15/18;G10L15/26;G10L25/51
代理公司：	北京潤澤恒知識產權代理有限公司 11319	代理人：	趙娟
地址：	100084 北京市海淀區中關***	國省代碼：	北京;11
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	一種語音識別方法裝置
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

本發明實施例提供了一種語音識別的方法和裝置，所述方法包括：當接收到語音數據，識別所述語音數據得到候選識別文本集合；判斷所述候選識別文本集合中是否存在易混淆詞對；若所述候選識別文本集合中存在易混淆詞對，則采用預置的語言模型和貝葉斯模型得到所述候選識別文本集合的候選識別文本的評分；采用所述評分從所述候選識別文本中篩選出目標識別文本。本發明實施例中引入貝葉斯評分，提高了語音數據中易混淆詞的識別準確度，提高了用戶體驗。

技術領域

本發明涉及語音技術領域，特別是涉及一種語音識別的方法和一種語音識別的裝置。

背景技術

目前，移動互聯網的快速發展帶動了移動智能設備如手機、平板電腦的廣泛普及，而作為移動設備上人機交互最方便自然的方式之一，語音識別正逐漸被廣大用戶所接受。

盡管隨著語音識別技術的發展，語音識別性能取得了較大進步，但是語音識別受到如發音相同等的易混淆詞的影響，很難從用戶的發音準確識別出而導致識別錯誤。

發明內容

鑒于上述問題，提出了本發明實施例以便提供一種克服上述問題或者至少部分地解決上述問題的一種語音識別的方法和相應的一種語音識別的裝置。

為了解決上述問題，本發明實施例公開了一種語音識別的方法，包括：

當接收到語音數據，識別所述語音數據得到候選識別文本集合；

判斷所述候選識別文本集合中是否存在易混淆詞對；

若所述候選識別文本集合中存在易混淆詞對，則采用預置的語言模型和貝葉斯模型得到所述候選識別文本集合的候選識別文本的評分；

采用所述評分從所述候選識別文本中篩選出目標識別文本。

可選地，還包括：

若所述候選識別文本集合中不存在易混淆詞對，則采用預置的語言模型得到所述候選識別文本集合的候選識別文本的評分。

可選地，所述判斷所述候選識別文本集合中是否存在易混淆詞對的步驟包括：

判斷所述候選識別文本集合中在預置易混淆詞庫中是否存在匹配項；

當所述候選識別文本集合中在預置易混淆詞庫中存在匹配項時，判斷為所述候選識別文本集合中存在易混淆詞對。

可選地，所述貝葉斯模型通過如下方式進行訓練：

從語料庫中抽取包含易混淆詞的訓練語料；

抽取所述訓練語料的訓練詞形；

采用所述訓練詞形訓練貝葉斯模型。

可選地，所述采用預置的語言模型和貝葉斯模型得到所述候選識別文本集合的候選識別文本的評分的步驟包括：

從所述候選識別文本中提取出詞形；

將所述詞形輸入到預置的貝葉斯模型，得到所述候選識別文本集合的候選識別文本的貝葉斯評分；

將所述詞形輸入到預置的語言模型，得到所述候選識別文本集合的候選識別文本的語言評分；

采用所述貝葉斯評分和語言評分得到所述候選識別文本的評分。

可選地，所述采用所述評分從所述候選識別文本中篩選出目標識別文本的步驟包括：

將所述評分按照由大到小的順序進行排序；

將所述排序在最前的評分所對應的候選識別文本作為目標識別文本。

可選地，所述語言模型通過如下方式進行訓練：

從語料庫中獲取注音訓練語料；

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于北京搜狗科技發展有限公司，未經北京搜狗科技發展有限公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201710065885.7/2.html，轉載請聲明來源鉆瓜專利網。

同類專利

專利分類

G 物理

G10 樂器；聲學
G10L 語音分析或合成；語音識別；音頻分析或處理
G10L15-00 語音識別
G10L15-02 .語音識別的特征提?。蛔R別單位的選擇
G10L15-04 .分段或字極限檢測
G10L15-06 .創建基準模板；訓練語音識別系統，例如對說話者聲音特征的適應
G10L15-08 .語音分類或檢索
G10L15-20 .專門適用于不利環境

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產權局專利說明書；

2、支持發明專利、實用新型專利、外觀設計專利（升級中）；

3、專利數據每周兩次同步更新，支持Adobe PDF格式；

4、內容包括專利技術的結構示意圖、流程工藝圖或技術構造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】