[發明專利]異構解碼網絡的構建方法及系統、語音識別方法及系統有效
| 申請號: | 201410290869.4 | 申請日: | 2014-06-24 |
| 公開(公告)號: | CN104064184B | 公開(公告)日: | 2017-03-08 |
| 發明(設計)人: | 鹿曉亮;單言豐;劉強 | 申請(專利權)人: | 科大訊飛股份有限公司 |
| 主分類號: | G10L15/183 | 分類號: | G10L15/183;G10L15/06 |
| 代理公司: | 北京維澳專利代理有限公司11252 | 代理人: | 王立民,吉海蓮 |
| 地址: | 230088 安徽省*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 解碼 網絡 構建 方法 系統 語音 識別 | ||
1.一種異構解碼網絡的構建方法,其特征在于,包括:
獲取業務所需的命令詞解碼網絡和聽寫解碼網絡,所述命令詞解碼網絡的每個弧上保存有一個命令詞條以及對應所述命令詞條的聲學模型得分,所述聽寫解碼網絡的每個弧上保存有一個聽寫詞條以及均對應所述聽寫詞條的聲學模型得分和語言模型得分;
構建命令詞訓練數據集和聽寫訓練數據集,所述命令詞訓練數據集內的命令詞訓練數據由所述命令詞條構成,所述聽寫訓練數據集內的聽寫訓練數據由所述聽寫詞條構成;
利用所述命令詞訓練數據集和所述聽寫訓練數據集,確定命令詞解碼網絡的補償得分;
優化所述命令詞解碼網絡,并使優化后的命令詞解碼網絡的每個弧上保存有所述命令詞條、所述補償得分、以及對應所述命令詞條的聲學模型得分;
將優化后的命令詞解碼網絡和所述聽寫解碼網絡并聯組成異構解碼網絡。
2.根據權利要求1所述的方法,其特征在于,所述利用所述命令詞訓練數據集和所述聽寫訓練數據集,確定命令詞解碼網絡的補償得分包括:
依次將所述命令詞訓練數據集內的每一個命令詞訓練數據輸入至所述命令詞解碼網絡和所述聽寫解碼網絡,分別得到對應所述命令詞訓練數據的第一命令詞網絡得分和第一聽寫網絡得分;所述第一命令詞網絡得分為與所述命令詞訓練數據相匹配的命令詞條對應的聲學模型得分,所述第一聽寫網絡得分為與所述命令詞訓練數據相匹配的聽寫詞條對應的聲學模型得分和語言模型得分之和;
依次將所述聽寫訓練數據集內的每一個聽寫訓練數據分別輸入至所述命令詞解碼網絡和所述聽寫解碼網絡,分別得到對應所述聽寫訓練數據的第二命令詞網絡得分和第二聽寫網絡得分,所述第二命令詞網絡得分為與所述聽寫訓練數據相匹配的命令詞條對應的聲學模型得分,所述第二聽寫網絡得分為與所述聽寫訓練數據相匹配的聽寫詞條對應的聲學模型得分和語言模型得分之和;
確定所述命令詞解碼網絡的補償得分,并使所述補償得分滿足預設條件:對于命令詞訓練數據集內的設定比例的命令詞訓練數據,所述第一命令詞網絡得分與所述補償得分之和大于所述第一聽寫網絡得分;對于聽寫訓練數據集內的設定比例的聽寫訓練數據,所述第二命令詞網絡得分與所述補償得分之和小于所述第二聽寫網絡得分。
3.根據權利要求2所述的方法,其特征在于,所述確定所述命令詞解碼網絡的補償得分,并使所述補償得分滿足預設條件包括:
獲取滿足第一取值范圍且能夠整除第一步進量的第一參數,以及滿足第二取值范圍且能夠整除第二步進量的第二參數的所有參數組合;
依次對每一組參數組合,獲取所述命令詞訓練數據集內滿足第一預設條件的命令詞訓練數據個數,所述第一預設條件為:所述第一參數和所述命令詞訓練數據對應的第一命令詞網絡得分的乘積與所述第二參數的和,大于所述命令詞訓練數據對應的第一聽寫網絡得分;
依次對每一組參數組合,獲取所述聽寫訓練數據集內滿足第二預設條件的聽寫訓練數據個數,所述第二預設條件為:所述第一參數和所述聽寫訓練數據對應的第二命令詞網絡得分的乘積與所述第二參數的和,小于所述聽寫訓練數據對應的第二聽寫網絡得分;
確定優選參數組合,所述優選參數組合對應的命令詞訓練數據個數和聽寫訓練數據個數之和,大于其它參數組合對應的命令詞訓練數據個數和聽寫訓練數據個數之和;
將所述優選參數組合中第一參數和任意第一命令詞網絡得分的乘積與所述優選參數組合中第二參數的和,再減去所述第一命令詞網絡得分所得的結果,作為所述命令詞解碼網絡的補償得分。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于科大訊飛股份有限公司,未經科大訊飛股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410290869.4/1.html,轉載請聲明來源鉆瓜專利網。





