[發(fā)明專利]一種輸出最優(yōu)識別結(jié)果的語音整合方法有效
| 申請?zhí)枺?/td> | 201910721884.2 | 申請日: | 2019-08-06 |
| 公開(公告)號: | CN110634481B | 公開(公告)日: | 2021-11-16 |
| 發(fā)明(設(shè)計)人: | 何川延 | 申請(專利權(quán))人: | 惠州市德賽西威汽車電子股份有限公司 |
| 主分類號: | G10L15/22 | 分類號: | G10L15/22;G10L15/28 |
| 代理公司: | 廣州三環(huán)專利商標(biāo)代理有限公司 44202 | 代理人: | 葉新平 |
| 地址: | 516006 廣東省*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 輸出 最優(yōu) 識別 結(jié)果 語音 整合 方法 | ||
本發(fā)明涉及語音識別技術(shù)領(lǐng)域,具體公開了一種輸出最優(yōu)識別結(jié)果的語音整合方法,先通過至少兩種語音識別算法得到對應(yīng)的語音識別源,然后將各個語音識別源進(jìn)行領(lǐng)域劃分、歸納,得到識別意圖及對應(yīng)的領(lǐng)域附帶參數(shù),并封裝成為一個歸納領(lǐng)域參數(shù)表格輸入到預(yù)置語音整合模型中進(jìn)行模型運算,確認(rèn)符合預(yù)想要求的最優(yōu)語音識別源,最后最優(yōu)語音識別源所對應(yīng)的語音指令觸發(fā)對應(yīng)的控制設(shè)備。實施本發(fā)明,每次用戶與語音助理交互時,用戶指令都會經(jīng)過幾個語音識別源的識別理解處理,最終篩選出最優(yōu)選項,避免出現(xiàn)因單個語音識別算法的能力不足或識別廣度深度的缺失導(dǎo)致的識別不出用戶意圖或識別錯誤的錯誤,提升了識別準(zhǔn)確率,優(yōu)化了用戶使用體驗。
技術(shù)領(lǐng)域
本發(fā)明涉及語音識別技術(shù)領(lǐng)域,尤其涉及一種輸出最優(yōu)識別結(jié)果的語音整合方法。
背景技術(shù)
當(dāng)前在各類聯(lián)網(wǎng)產(chǎn)品當(dāng)中,語音識別扮演著重要的角色。以車聯(lián)網(wǎng)產(chǎn)品為例,車載語音識別的正確與否,極大程度上影響著車聯(lián)網(wǎng)產(chǎn)品的體驗好壞。例如用戶在開車過程中發(fā)現(xiàn)副駕駛位車窗沒有關(guān)閉,喚醒語音后說出“風(fēng)有點大,關(guān)下窗戶吧”這個自然語言指令時,部分車載語音會嘗試把空調(diào)風(fēng)量降低,將用戶指令意圖搞錯,部分車載語音會反饋無法理解用戶指令意圖。而出現(xiàn)用戶指令意圖無法正確識別的情況,主要在于車載語音產(chǎn)品存在的語音識別算法單一、語義理解訓(xùn)練不足、語料庫覆蓋不完全的技術(shù)缺陷。
發(fā)明內(nèi)容
本發(fā)明提供一種輸出最優(yōu)識別結(jié)果的語音整合方法,解決了現(xiàn)有聯(lián)網(wǎng)產(chǎn)品的語音識別功能存在的語音識別算法單一、語義理解訓(xùn)練不足、語料庫覆蓋不完全的技術(shù)問題。
為解決以上技術(shù)問題,本發(fā)明提供一種輸出最優(yōu)識別結(jié)果的語音整合方法,包括步驟:
S1.通過至少兩種語音識別算法對用戶發(fā)出的一條語音指令進(jìn)行識別,得到對應(yīng)的至少兩條語音識別源;
S2.將所述至少兩條語音識別源歸納分解到統(tǒng)一的數(shù)據(jù)管理容器中,進(jìn)一步生成歸納領(lǐng)域參數(shù)表格;
S3.通過預(yù)置語音整合模型對所述歸納領(lǐng)域參數(shù)表格進(jìn)行過濾選擇,輸出最優(yōu)語音識別源。
進(jìn)一步地,所述步驟S2具體包括步驟:
S21.在數(shù)據(jù)管理容器中歸納出每條所述語音識別源的識別意圖;
S22.歸納出每條所述語音識別源的領(lǐng)域附帶參數(shù)并整理在對應(yīng)的所述識別意圖下,領(lǐng)域附帶參數(shù)為反應(yīng)用戶語音指令識別結(jié)果功能領(lǐng)域的附帶參數(shù);
S23.將所述數(shù)據(jù)管理容器中每條所述語音識別源的識別意圖及對應(yīng)的領(lǐng)域附帶參數(shù)封裝為一個歸納領(lǐng)域參數(shù)表格。
進(jìn)一步地,所述步驟S3具體包括步驟:
S31.將所述歸納領(lǐng)域參數(shù)表格輸入至所述預(yù)置語音整合模型中;
S32.所述預(yù)置語音整合模型篩選出最優(yōu)語音識別源;
S33.輸出所述最優(yōu)語音識別源。
進(jìn)一步地,所述步驟S32中,所述預(yù)置語音整合模型完成的步驟包括:
S32-1.獲取每條所述語音識別源的靜態(tài)參數(shù)和動態(tài)參數(shù);
S32-2.根據(jù)所述靜態(tài)參數(shù)和動態(tài)參數(shù)計算每條所述語音識別源的結(jié)果評分值;
S32-3.通過比較確定所述結(jié)果評分值最大的所述語音識別源為所述最優(yōu)識別源。
進(jìn)一步地,在所述步驟S32-1中,每條所述語音識別源的靜態(tài)參數(shù)包括權(quán)重比例Wn、項目需求賦權(quán)Pn、模型測試反饋Mn,n代表每條所述語音識別源的編號;
所述權(quán)重比例Wn代表根據(jù)每條所述語音識別源的識別意圖而查找得到的權(quán)重初始值;
所述項目需求賦權(quán)Pn代表根據(jù)實際需要建立的對每條所述語音識別源的識別意圖的需求分子;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于惠州市德賽西威汽車電子股份有限公司,未經(jīng)惠州市德賽西威汽車電子股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910721884.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





