[發明專利]異構解碼網絡的構建方法及系統、語音識別方法及系統有效

申請號：	201410290869.4	申請日：	2014-06-24
公開（公告）號：	CN104064184B	公開（公告）日：	2017-03-08
發明（設計）人：	鹿曉亮;單言豐;劉強	申請（專利權）人：	科大訊飛股份有限公司
主分類號：	G10L15/183	分類號：	G10L15/183;G10L15/06
代理公司：	北京維澳專利代理有限公司11252	代理人：	王立民,吉海蓮
地址：	230088 安徽省***	國省代碼：	安徽;34
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	解碼網絡構建方法系統語音識別
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【權利要求書】：

1.一種異構解碼網絡的構建方法，其特征在于，包括：

獲取業務所需的命令詞解碼網絡和聽寫解碼網絡，所述命令詞解碼網絡的每個弧上保存有一個命令詞條以及對應所述命令詞條的聲學模型得分，所述聽寫解碼網絡的每個弧上保存有一個聽寫詞條以及均對應所述聽寫詞條的聲學模型得分和語言模型得分；

構建命令詞訓練數據集和聽寫訓練數據集，所述命令詞訓練數據集內的命令詞訓練數據由所述命令詞條構成，所述聽寫訓練數據集內的聽寫訓練數據由所述聽寫詞條構成；

利用所述命令詞訓練數據集和所述聽寫訓練數據集，確定命令詞解碼網絡的補償得分；

優化所述命令詞解碼網絡，并使優化后的命令詞解碼網絡的每個弧上保存有所述命令詞條、所述補償得分、以及對應所述命令詞條的聲學模型得分；

將優化后的命令詞解碼網絡和所述聽寫解碼網絡并聯組成異構解碼網絡。

2.根據權利要求1所述的方法，其特征在于，所述利用所述命令詞訓練數據集和所述聽寫訓練數據集，確定命令詞解碼網絡的補償得分包括：

依次將所述命令詞訓練數據集內的每一個命令詞訓練數據輸入至所述命令詞解碼網絡和所述聽寫解碼網絡，分別得到對應所述命令詞訓練數據的第一命令詞網絡得分和第一聽寫網絡得分；所述第一命令詞網絡得分為與所述命令詞訓練數據相匹配的命令詞條對應的聲學模型得分，所述第一聽寫網絡得分為與所述命令詞訓練數據相匹配的聽寫詞條對應的聲學模型得分和語言模型得分之和；

依次將所述聽寫訓練數據集內的每一個聽寫訓練數據分別輸入至所述命令詞解碼網絡和所述聽寫解碼網絡，分別得到對應所述聽寫訓練數據的第二命令詞網絡得分和第二聽寫網絡得分，所述第二命令詞網絡得分為與所述聽寫訓練數據相匹配的命令詞條對應的聲學模型得分，所述第二聽寫網絡得分為與所述聽寫訓練數據相匹配的聽寫詞條對應的聲學模型得分和語言模型得分之和；

確定所述命令詞解碼網絡的補償得分，并使所述補償得分滿足預設條件：對于命令詞訓練數據集內的設定比例的命令詞訓練數據，所述第一命令詞網絡得分與所述補償得分之和大于所述第一聽寫網絡得分；對于聽寫訓練數據集內的設定比例的聽寫訓練數據，所述第二命令詞網絡得分與所述補償得分之和小于所述第二聽寫網絡得分。

3.根據權利要求2所述的方法，其特征在于，所述確定所述命令詞解碼網絡的補償得分，并使所述補償得分滿足預設條件包括：

獲取滿足第一取值范圍且能夠整除第一步進量的第一參數，以及滿足第二取值范圍且能夠整除第二步進量的第二參數的所有參數組合；

依次對每一組參數組合，獲取所述命令詞訓練數據集內滿足第一預設條件的命令詞訓練數據個數，所述第一預設條件為：所述第一參數和所述命令詞訓練數據對應的第一命令詞網絡得分的乘積與所述第二參數的和，大于所述命令詞訓練數據對應的第一聽寫網絡得分；

依次對每一組參數組合，獲取所述聽寫訓練數據集內滿足第二預設條件的聽寫訓練數據個數，所述第二預設條件為：所述第一參數和所述聽寫訓練數據對應的第二命令詞網絡得分的乘積與所述第二參數的和，小于所述聽寫訓練數據對應的第二聽寫網絡得分；

確定優選參數組合，所述優選參數組合對應的命令詞訓練數據個數和聽寫訓練數據個數之和，大于其它參數組合對應的命令詞訓練數據個數和聽寫訓練數據個數之和；

將所述優選參數組合中第一參數和任意第一命令詞網絡得分的乘積與所述優選參數組合中第二參數的和，再減去所述第一命令詞網絡得分所得的結果，作為所述命令詞解碼網絡的補償得分。

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于科大訊飛股份有限公司，未經科大訊飛股份有限公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201410290869.4/1.html，轉載請聲明來源鉆瓜專利網。

上一篇：一種基于語音前端噪聲消除的提高語音識別準確率的方法
下一篇：一種像素電路、有機電致發光顯示面板及顯示裝置

同類專利

專利分類

G 物理

G10 樂器；聲學
G10L 語音分析或合成；語音識別；音頻分析或處理
G10L15-00 語音識別
G10L15-02 .語音識別的特征提取；識別單位的選擇
G10L15-04 .分段或字極限檢測
G10L15-06 .創建基準模板；訓練語音識別系統，例如對說話者聲音特征的適應
G10L15-08 .語音分類或檢索
G10L15-20 .專門適用于不利環境

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產權局專利說明書；

2、支持發明專利、實用新型專利、外觀設計專利（升級中）；

3、專利數據每周兩次同步更新，支持Adobe PDF格式；

4、內容包括專利技術的結構示意圖、流程工藝圖或技術構造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】