[發明專利]用于語音識別的系統和方法有效
| 申請號: | 201780060607.0 | 申請日: | 2017-09-14 |
| 公開(公告)號: | CN109791767B | 公開(公告)日: | 2023-09-05 |
| 發明(設計)人: | Z.周;Z.馮 | 申請(專利權)人: | 羅伯特·博世有限公司 |
| 主分類號: | G10L15/32 | 分類號: | G10L15/32;G10L15/22 |
| 代理公司: | 中國專利代理(香港)有限公司 72001 | 代理人: | 畢錚;申屠偉進 |
| 地址: | 德國斯*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 語音 識別 系統 方法 | ||
1.一種用于自動化系統中的語音識別的方法,包括:
利用音頻輸入設備生成對應于來自用戶的語音輸入的音頻輸入數據;
利用控制器,使用第一通用語音識別引擎生成對應于音頻輸入數據的第一多個候選語音識別結果;
利用控制器,使用第一特定于域的語音識別引擎生成對應于音頻輸入數據的第二多個候選語音識別結果;
利用控制器生成第三多個候選語音識別結果,第三多個候選語音識別結果中的每個候選語音識別結果包括第一多個候選語音識別結果中的一個中包括的多個單詞和第二多個候選語音識別結果中的另一個中包括的至少一個單詞;
利用控制器,使用成對排序器對至少第三多個候選語音識別結果進行排序,以標識排序最高的候選語音識別結果;以及
利用控制器,使用排序最高的候選語音識別結果作為來自用戶的輸入來操作所述自動化系統。
2.根據權利要求1所述的方法,第三多個候選語音識別結果中的至少一個候選語音識別結果的生成還包括:
利用控制器標識第一多個候選語音識別結果中的第一候選語音識別結果的第一多個單詞中的第一單詞,所述第一單詞對應于第二多個候選語音識別結果中的第二候選語音識別結果中的第二多個單詞中的第二單詞,第二單詞與第一單詞不同;以及
利用控制器生成針對第三多個候選語音識別結果的候選語音識別結果,所述候選語音識別結果包括來自第一候選語音識別結果的第一多個單詞與來自第二候選語音識別結果的代替來自第一候選語音識別結果的第一單詞的第二單詞。
3.根據權利要求2所述的方法,還包括:
利用控制器,基于第二多個單詞中也存在于第一多個單詞中的至少一個單詞的位置,將第二候選語音識別結果中的第二多個單詞與第一候選語音識別結果中的第一多個單詞對齊;以及
利用控制器,標識第一多個語音識別中的第一候選語音識別結果的第一多個單詞中的第一單詞,所述第一單詞在與第二多個單詞對齊的第一多個單詞中的單詞位置處對應于第二候選語音識別結果中的第二多個單詞中的第二單詞。
4.根據權利要求1所述的方法,排序還包括:
利用控制器,使用成對排序器來在從第三多個候選語音識別結果中選擇的多對候選語音識別結果之間使用成對排序過程、基于排序分數來標識排序最高的候選語音識別結果,每對候選語音識別結果的排序還包括:
利用控制器,使用成對排序器估計第三多個候選語音識別結果中的第一候選語音識別結果的第一單詞錯誤率;
利用控制器,使用成對排序器估計第三多個候選語音識別結果中的第二候選語音識別結果的第二單詞錯誤率;
利用控制器,響應于第一單詞錯誤率小于第二單詞錯誤率而增加與第一候選語音識別結果相關聯的排序分數;以及
利用控制器,響應于第一單詞錯誤率大于第二單詞錯誤率而增加與第二候選語音識別結果相關聯的另一排序分數。
5.根據權利要求4所述的方法,還包括:
利用控制器,參考存儲在存儲器中的多個預定觸發對,生成包括對應于至少一個觸發對的特征的第一特征向量,所述至少一個觸發對包括第一候選語音識別結果內的兩個預定觸發單詞;
利用控制器,參考多個預定觸發對,生成包括對應于至少一個觸發對的特征的第二特征向量,所述至少一個觸發對包括第二候選語音識別結果內的兩個預定觸發單詞;
利用控制器,基于第一特征向量和第二特征向量之間的差異生成第三特征向量;以及
利用控制器,使用成對排序器基于第三特征向量來估計第一候選語音識別結果中的第一單詞錯誤率和第二候選語音識別結果中的第二單詞錯誤率。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于羅伯特·博世有限公司,未經羅伯特·博世有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201780060607.0/1.html,轉載請聲明來源鉆瓜專利網。





