[發(fā)明專利]一種輸出最優(yōu)識別結(jié)果的語音整合方法有效

申請?zhí)枺?/td>	201910721884.2	申請日：	2019-08-06
公開（公告）號：	CN110634481B	公開（公告）日：	2021-11-16
發(fā)明（設(shè)計）人：	何川延	申請（專利權(quán)）人：	惠州市德賽西威汽車電子股份有限公司
主分類號：	G10L15/22	分類號：	G10L15/22;G10L15/28
代理公司：	廣州三環(huán)專利商標(biāo)代理有限公司 44202	代理人：	葉新平
地址：	516006 廣東省***	國省代碼：	廣東;44
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	一種輸出最優(yōu) 識別結(jié)果語音整合方法
鉆瓜網(wǎng) 技術(shù)展會專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【說明書】：

本發(fā)明涉及語音識別技術(shù)領(lǐng)域，具體公開了一種輸出最優(yōu)識別結(jié)果的語音整合方法，先通過至少兩種語音識別算法得到對應(yīng)的語音識別源，然后將各個語音識別源進(jìn)行領(lǐng)域劃分、歸納，得到識別意圖及對應(yīng)的領(lǐng)域附帶參數(shù)，并封裝成為一個歸納領(lǐng)域參數(shù)表格輸入到預(yù)置語音整合模型中進(jìn)行模型運算，確認(rèn)符合預(yù)想要求的最優(yōu)語音識別源，最后最優(yōu)語音識別源所對應(yīng)的語音指令觸發(fā)對應(yīng)的控制設(shè)備。實施本發(fā)明，每次用戶與語音助理交互時，用戶指令都會經(jīng)過幾個語音識別源的識別理解處理，最終篩選出最優(yōu)選項，避免出現(xiàn)因單個語音識別算法的能力不足或識別廣度深度的缺失導(dǎo)致的識別不出用戶意圖或識別錯誤的錯誤，提升了識別準(zhǔn)確率，優(yōu)化了用戶使用體驗。

技術(shù)領(lǐng)域

本發(fā)明涉及語音識別技術(shù)領(lǐng)域，尤其涉及一種輸出最優(yōu)識別結(jié)果的語音整合方法。

背景技術(shù)

當(dāng)前在各類聯(lián)網(wǎng)產(chǎn)品當(dāng)中，語音識別扮演著重要的角色。以車聯(lián)網(wǎng)產(chǎn)品為例，車載語音識別的正確與否，極大程度上影響著車聯(lián)網(wǎng)產(chǎn)品的體驗好壞。例如用戶在開車過程中發(fā)現(xiàn)副駕駛位車窗沒有關(guān)閉，喚醒語音后說出“風(fēng)有點大，關(guān)下窗戶吧”這個自然語言指令時，部分車載語音會嘗試把空調(diào)風(fēng)量降低，將用戶指令意圖搞錯，部分車載語音會反饋無法理解用戶指令意圖。而出現(xiàn)用戶指令意圖無法正確識別的情況，主要在于車載語音產(chǎn)品存在的語音識別算法單一、語義理解訓(xùn)練不足、語料庫覆蓋不完全的技術(shù)缺陷。

發(fā)明內(nèi)容

本發(fā)明提供一種輸出最優(yōu)識別結(jié)果的語音整合方法，解決了現(xiàn)有聯(lián)網(wǎng)產(chǎn)品的語音識別功能存在的語音識別算法單一、語義理解訓(xùn)練不足、語料庫覆蓋不完全的技術(shù)問題。

為解決以上技術(shù)問題，本發(fā)明提供一種輸出最優(yōu)識別結(jié)果的語音整合方法，包括步驟：

S1.通過至少兩種語音識別算法對用戶發(fā)出的一條語音指令進(jìn)行識別，得到對應(yīng)的至少兩條語音識別源；

S2.將所述至少兩條語音識別源歸納分解到統(tǒng)一的數(shù)據(jù)管理容器中，進(jìn)一步生成歸納領(lǐng)域參數(shù)表格；

S3.通過預(yù)置語音整合模型對所述歸納領(lǐng)域參數(shù)表格進(jìn)行過濾選擇，輸出最優(yōu)語音識別源。

進(jìn)一步地，所述步驟S2具體包括步驟：

S21.在數(shù)據(jù)管理容器中歸納出每條所述語音識別源的識別意圖；

S22.歸納出每條所述語音識別源的領(lǐng)域附帶參數(shù)并整理在對應(yīng)的所述識別意圖下，領(lǐng)域附帶參數(shù)為反應(yīng)用戶語音指令識別結(jié)果功能領(lǐng)域的附帶參數(shù)；

S23.將所述數(shù)據(jù)管理容器中每條所述語音識別源的識別意圖及對應(yīng)的領(lǐng)域附帶參數(shù)封裝為一個歸納領(lǐng)域參數(shù)表格。

進(jìn)一步地，所述步驟S3具體包括步驟：

S31.將所述歸納領(lǐng)域參數(shù)表格輸入至所述預(yù)置語音整合模型中；

S32.所述預(yù)置語音整合模型篩選出最優(yōu)語音識別源；

S33.輸出所述最優(yōu)語音識別源。

進(jìn)一步地，所述步驟S32中，所述預(yù)置語音整合模型完成的步驟包括：

S32-1.獲取每條所述語音識別源的靜態(tài)參數(shù)和動態(tài)參數(shù)；

S32-2.根據(jù)所述靜態(tài)參數(shù)和動態(tài)參數(shù)計算每條所述語音識別源的結(jié)果評分值；

S32-3.通過比較確定所述結(jié)果評分值最大的所述語音識別源為所述最優(yōu)識別源。

進(jìn)一步地，在所述步驟S32-1中，每條所述語音識別源的靜態(tài)參數(shù)包括權(quán)重比例Wn、項目需求賦權(quán)Pn、模型測試反饋Mn，n代表每條所述語音識別源的編號；

所述權(quán)重比例Wn代表根據(jù)每條所述語音識別源的識別意圖而查找得到的權(quán)重初始值；

所述項目需求賦權(quán)Pn代表根據(jù)實際需要建立的對每條所述語音識別源的識別意圖的需求分子；

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于惠州市德賽西威汽車電子股份有限公司，未經(jīng)惠州市德賽西威汽車電子股份有限公司許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201910721884.2/2.html，轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

上一篇：語音對話系統(tǒng)與模型創(chuàng)建裝置及其方法
下一篇：智能控制系統(tǒng)及智能插座

同類專利

專利分類

G 物理

G10 樂器；聲學(xué)
G10L 語音分析或合成；語音識別；音頻分析或處理
G10L15-00 語音識別
G10L15-02 .語音識別的特征提取；識別單位的選擇
G10L15-04 .分段或字極限檢測
G10L15-06 .創(chuàng)建基準(zhǔn)模板；訓(xùn)練語音識別系統(tǒng)，例如對說話者聲音特征的適應(yīng)
G10L15-08 .語音分類或檢索
G10L15-20 .專門適用于不利環(huán)境

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻(xiàn)下載

說明：

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書；

2、支持發(fā)明專利、實用新型專利、外觀設(shè)計專利（升級中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進(jìn)行下載，點擊【登陸】【注冊】