[發(fā)明專利]用于語音識(shí)別的系統(tǒng)和方法有效
| 申請(qǐng)?zhí)枺?/td> | 201780060607.0 | 申請(qǐng)日: | 2017-09-14 |
| 公開(公告)號(hào): | CN109791767B | 公開(公告)日: | 2023-09-05 |
| 發(fā)明(設(shè)計(jì))人: | Z.周;Z.馮 | 申請(qǐng)(專利權(quán))人: | 羅伯特·博世有限公司 |
| 主分類號(hào): | G10L15/32 | 分類號(hào): | G10L15/32;G10L15/22 |
| 代理公司: | 中國專利代理(香港)有限公司 72001 | 代理人: | 畢錚;申屠偉進(jìn) |
| 地址: | 德國斯*** | 國省代碼: | 暫無信息 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 用于 語音 識(shí)別 系統(tǒng) 方法 | ||
用于自動(dòng)化語音識(shí)別的方法包括分別使用第一通用語音識(shí)別引擎和第二特定于域的語音識(shí)別引擎生成對(duì)應(yīng)于音頻輸入數(shù)據(jù)的第一和第二多個(gè)候選語音識(shí)別結(jié)果。所述方法還包括:生成第三多個(gè)候選語音識(shí)別結(jié)果,其包括第一多個(gè)語音識(shí)別結(jié)果中的一個(gè)中包括的多個(gè)單詞和第二多個(gè)語音識(shí)別結(jié)果中的另一個(gè)中包括的至少一個(gè)單詞;使用成對(duì)排序器對(duì)第三多個(gè)候選語音識(shí)別結(jié)果進(jìn)行排序,以標(biāo)識(shí)排序最高的候選語音識(shí)別結(jié)果;以及使用排序最高的語音識(shí)別結(jié)果作為來自用戶的輸入來操作自動(dòng)化系統(tǒng)。
技術(shù)領(lǐng)域
本公開總地涉及自動(dòng)化語音識(shí)別領(lǐng)域,并且更具體地,涉及改進(jìn)利用多個(gè)語音識(shí)別引擎的語音識(shí)別系統(tǒng)的操作的系統(tǒng)和方法。
背景技術(shù)
自動(dòng)化語音識(shí)別是在寬范圍的應(yīng)用中實(shí)現(xiàn)人機(jī)接口(HMI)的重要技術(shù)。具體地,語音識(shí)別在這樣的情形下是有用的:人類用戶需要聚焦于執(zhí)行其中使用諸如鼠標(biāo)和鍵盤之類的傳統(tǒng)輸入設(shè)備將是不方便或不實(shí)際的任務(wù)。例如,車載“信息娛樂”系統(tǒng)、家庭自動(dòng)系統(tǒng)以及諸如智能電話、平板計(jì)算機(jī)和可穿戴計(jì)算機(jī)的小電子移動(dòng)設(shè)備的很多用途可以采用語音識(shí)別來接收來自用戶的語音命令和其他輸入。
大多數(shù)現(xiàn)有技術(shù)的語音識(shí)別系統(tǒng)使用經(jīng)訓(xùn)練的語音識(shí)別引擎將來自用戶的記錄的口頭輸入轉(zhuǎn)換成適合于在計(jì)算機(jī)化系統(tǒng)中處理的數(shù)字?jǐn)?shù)據(jù)。本領(lǐng)域已知的各種語音引擎執(zhí)行自然語言理解技術(shù)以識(shí)別用戶說出的單詞并從單詞中提取語義含義來控制計(jì)算機(jī)化系統(tǒng)的操作。
在一些情形下,當(dāng)用戶執(zhí)行不同任務(wù)時(shí),單個(gè)語音識(shí)別引擎對(duì)于識(shí)別來自用戶的語音而言不一定是最佳的。現(xiàn)有技術(shù)解決方案試圖組合多個(gè)語音識(shí)別系統(tǒng)以改進(jìn)語音識(shí)別的準(zhǔn)確度,包括基于預(yù)定的排序過程從聲學(xué)模型不同語音識(shí)別模型中選擇低級(jí)輸出或從不同語音識(shí)別引擎中選擇整組輸出。然而,從不同語音識(shí)別引擎中挑選輸出的現(xiàn)有技術(shù)通常不適合于在特定任務(wù)中使用,在所述特定任務(wù)中用戶通常采用來自自然語言的一些語音但是將自然語言語音命令與用于特定目的的單詞和句子組合。例如,在車載信息娛樂系統(tǒng)中,來自車輛操作者的語音輸入可能包括與語音識(shí)別引擎未很好識(shí)別的特定單詞和短語組合的諸如英語或中文的自然語言,并且僅選擇每個(gè)高概率包括錯(cuò)誤的不同語音識(shí)別引擎的輸出不會(huì)增大語音識(shí)別的整體準(zhǔn)確度。此外,僅組合諸如聲學(xué)模型輸出之類的低級(jí)輸出或來自多個(gè)語音識(shí)別引擎的其他低級(jí)特征的現(xiàn)有語音識(shí)別系統(tǒng)不能使用較高級(jí)語言學(xué)特征來評(píng)估不同語音識(shí)別引擎的輸出。因此,對(duì)自動(dòng)化系統(tǒng)的操作的改進(jìn)以增大使用多個(gè)語音識(shí)別引擎的語音識(shí)別的準(zhǔn)確度將是有益的。
發(fā)明內(nèi)容
在一個(gè)實(shí)施例中,已經(jīng)開發(fā)了一種用于使用混合語音識(shí)別結(jié)果來執(zhí)行語音識(shí)別的方法。所述方法包括:利用音頻輸入設(shè)備生成對(duì)應(yīng)于來自用戶的語音輸入的音頻輸入數(shù)據(jù);利用控制器,使用第一通用語音識(shí)別引擎生成對(duì)應(yīng)于音頻輸入數(shù)據(jù)的第一多個(gè)候選語音識(shí)別結(jié)果;利用控制器,使用第一特定于域的語音識(shí)別引擎生成對(duì)應(yīng)于音頻輸入數(shù)據(jù)的第二多個(gè)候選語音識(shí)別結(jié)果;利用控制器生成第三多個(gè)候選語音識(shí)別結(jié)果,第三多個(gè)候選語音識(shí)別結(jié)果中的每個(gè)候選語音識(shí)別結(jié)果包括第一多個(gè)候選語音識(shí)別結(jié)果中的一個(gè)中包括的多個(gè)單詞和第二多個(gè)候選語音識(shí)別結(jié)果中的另一個(gè)中包括的至少一個(gè)單詞;利用控制器,使用成對(duì)排序器對(duì)至少第三多個(gè)語音識(shí)別結(jié)果進(jìn)行排序,以標(biāo)識(shí)排序最高的候選語音識(shí)別結(jié)果;以及利用控制器,使用排序最高的候選語音識(shí)別結(jié)果作為來自用戶的輸入來操作自動(dòng)化系統(tǒng)。
在另一個(gè)實(shí)施例中,已經(jīng)開發(fā)了一種使用混合語音識(shí)別結(jié)果執(zhí)行語音識(shí)別的自動(dòng)化系統(tǒng)。所述系統(tǒng)包括:音頻輸入設(shè)備,其被配置為生成對(duì)應(yīng)于來自用戶的語音輸入的音頻輸入數(shù)據(jù);以及控制器,其操作性地連接到音頻輸入設(shè)備和存儲(chǔ)器。控制器被配置為:從音頻輸入設(shè)備接收音頻輸入數(shù)據(jù);使用第一通用語音識(shí)別引擎生成對(duì)應(yīng)于音頻輸入數(shù)據(jù)的第一多個(gè)候選語音識(shí)別結(jié)果;使用第一特定于域的語音識(shí)別引擎生成對(duì)應(yīng)于音頻輸入數(shù)據(jù)的第二多個(gè)候選語音識(shí)別結(jié)果;生成第三多個(gè)候選語音識(shí)別結(jié)果,第三多個(gè)候選語音識(shí)別結(jié)果中的每個(gè)候選語音識(shí)別結(jié)果包括第一多個(gè)候選語音識(shí)別結(jié)果中的一個(gè)中包括的多個(gè)單詞和第二多個(gè)候選語音識(shí)別結(jié)果中的另一個(gè)中包括的至少一個(gè)單詞;使用成對(duì)排序器對(duì)至少第三多個(gè)候選語音識(shí)別結(jié)果進(jìn)行排序,以標(biāo)識(shí)排序最高的候選語音識(shí)別結(jié)果;以及使用排序最高的候選語音識(shí)別結(jié)果作為來自用戶的輸入來操作所述自動(dòng)化系統(tǒng)。
附圖說明
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于羅伯特·博世有限公司,未經(jīng)羅伯特·博世有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201780060607.0/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 識(shí)別媒體、識(shí)別媒體的識(shí)別方法、識(shí)別對(duì)象物品以及識(shí)別裝置
- 一種探針卡識(shí)別裝置和方法
- 識(shí)別裝置、識(shí)別方法以及記錄介質(zhì)
- 識(shí)別裝置、識(shí)別系統(tǒng),識(shí)別方法以及存儲(chǔ)介質(zhì)
- 識(shí)別程序、識(shí)別方法以及識(shí)別裝置
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 識(shí)別裝置、識(shí)別方法以及識(shí)別程序
- 識(shí)別裝置、識(shí)別方法及識(shí)別程序





