[發(fā)明專(zhuān)利]一種語(yǔ)音識(shí)別引擎確定方法、裝置及計(jì)算機(jī)設(shè)備在審
| 申請(qǐng)?zhí)枺?/td> | 202210308958.1 | 申請(qǐng)日: | 2022-03-24 |
| 公開(kāi)(公告)號(hào): | CN114596862A | 公開(kāi)(公告)日: | 2022-06-07 |
| 發(fā)明(設(shè)計(jì))人: | 王俊偉 | 申請(qǐng)(專(zhuān)利權(quán))人: | 南京四維智聯(lián)科技有限公司 |
| 主分類(lèi)號(hào): | G10L15/32 | 分類(lèi)號(hào): | G10L15/32 |
| 代理公司: | 北京三聚陽(yáng)光知識(shí)產(chǎn)權(quán)代理有限公司 11250 | 代理人: | 王藝涵 |
| 地址: | 210044 江蘇省南京市江北新區(qū)智*** | 國(guó)省代碼: | 江蘇;32 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 語(yǔ)音 識(shí)別 引擎 確定 方法 裝置 計(jì)算機(jī) 設(shè)備 | ||
本發(fā)明公開(kāi)了一種語(yǔ)音識(shí)別引擎確定方法、裝置及計(jì)算機(jī)設(shè)備,該方法包括,當(dāng)確定本次采集的語(yǔ)音數(shù)據(jù)為首次采集的語(yǔ)音數(shù)據(jù)時(shí),將語(yǔ)音數(shù)據(jù)分別輸入到至少兩個(gè)語(yǔ)音識(shí)別引擎,得到至少兩個(gè)語(yǔ)音識(shí)別結(jié)果;在語(yǔ)義識(shí)別結(jié)果包括語(yǔ)音數(shù)據(jù)處理時(shí)間和語(yǔ)音數(shù)據(jù)處理自信度,基于語(yǔ)音數(shù)據(jù)處理時(shí)間和語(yǔ)音數(shù)據(jù)處理自信度,從至少兩個(gè)語(yǔ)音識(shí)別引擎中選擇一個(gè)語(yǔ)音識(shí)別引擎作為目標(biāo)識(shí)別引擎。根據(jù)該方式,根據(jù)對(duì)首次采集的語(yǔ)音數(shù)據(jù)的處理結(jié)果,合理的選擇目標(biāo)識(shí)別引擎。針對(duì)場(chǎng)景的不同,選取與應(yīng)用場(chǎng)景最適宜的目標(biāo)識(shí)別引擎,可以充分利用某個(gè)語(yǔ)音識(shí)別引擎只針對(duì)特定場(chǎng)景的語(yǔ)音識(shí)別有效的特點(diǎn),實(shí)現(xiàn)在不同語(yǔ)音識(shí)別場(chǎng)景靈活切換不同語(yǔ)音識(shí)別引擎,提升了用戶(hù)體驗(yàn)度。
技術(shù)領(lǐng)域
本發(fā)明涉及語(yǔ)音識(shí)別技術(shù)領(lǐng)域,具體涉及一種語(yǔ)音識(shí)別引擎確定方法、裝置及計(jì)算機(jī)設(shè)備。
背景技術(shù)
隨著汽車(chē)行業(yè)的發(fā)展,用戶(hù)對(duì)車(chē)內(nèi)語(yǔ)音識(shí)別助手的要求越來(lái)越高,由于導(dǎo)航車(chē)機(jī)的語(yǔ)音助手識(shí)別率普遍不是很好,不能準(zhǔn)確識(shí)別駕駛?cè)伺c乘車(chē)人的交互意圖,導(dǎo)致對(duì)于駕駛?cè)伺c乘車(chē)人的駕駛體驗(yàn)與語(yǔ)音控制體驗(yàn)等效果不佳。
現(xiàn)有技術(shù)下的語(yǔ)音助手采用的供應(yīng)商引擎的識(shí)別與理解,針對(duì)某些特定場(chǎng)景或技能的識(shí)別有效,但是對(duì)于其他場(chǎng)景或技能,對(duì)語(yǔ)義識(shí)別與理解的效果不佳,甚至是無(wú)法識(shí)別,導(dǎo)致現(xiàn)有的語(yǔ)音助手在某些場(chǎng)景或技能下不能很好的識(shí)別與理解用戶(hù)的意圖。
發(fā)明內(nèi)容
因此,本發(fā)明要解決的技術(shù)問(wèn)題在于克服現(xiàn)有的車(chē)內(nèi)語(yǔ)音識(shí)別助手存在對(duì)某些場(chǎng)景或技能的識(shí)別準(zhǔn)確率不高的缺陷,從而提供一種語(yǔ)音識(shí)別引擎確定方法、裝置及計(jì)算機(jī)設(shè)備。
根據(jù)第一方面,本發(fā)明實(shí)施例公開(kāi)了一種語(yǔ)音識(shí)別引擎確定方法,該方法應(yīng)用于任一個(gè)利用語(yǔ)音進(jìn)行人機(jī)交互的場(chǎng)景下,方法包括:當(dāng)確定本次采集的語(yǔ)音數(shù)據(jù)為首次采集的語(yǔ)音數(shù)據(jù)時(shí),將語(yǔ)音數(shù)據(jù)分別輸入到至少兩個(gè)語(yǔ)音識(shí)別引擎,得到至少兩個(gè)語(yǔ)音識(shí)別結(jié)果,其中,所述語(yǔ)音識(shí)別結(jié)果包括語(yǔ)音數(shù)據(jù)處理時(shí)間和語(yǔ)音數(shù)據(jù)處理自信度;基于所述語(yǔ)音數(shù)據(jù)處理時(shí)間和語(yǔ)音數(shù)據(jù)處理自信度,從至少兩個(gè)所述語(yǔ)音識(shí)別引擎中選擇一個(gè)語(yǔ)音識(shí)別引擎作為目標(biāo)識(shí)別引擎,所述目標(biāo)識(shí)別引擎用以對(duì)所述場(chǎng)景下后續(xù)采集的所述語(yǔ)音數(shù)據(jù)進(jìn)行語(yǔ)義識(shí)別處理。
可選地,所述基于所述語(yǔ)音數(shù)據(jù)處理時(shí)間和語(yǔ)音數(shù)據(jù)處理自信度,從至少兩個(gè)所述語(yǔ)音識(shí)別引擎中選擇一個(gè)語(yǔ)音識(shí)別引擎作為目標(biāo)識(shí)別引擎,包括:當(dāng)所述語(yǔ)音數(shù)據(jù)處理時(shí)間相同時(shí),直接根據(jù)所述語(yǔ)音數(shù)據(jù)處理自信度,從至少兩個(gè)所述語(yǔ)音識(shí)別引擎中選擇所述目標(biāo)識(shí)別引擎;或者,當(dāng)所述語(yǔ)音數(shù)據(jù)處理時(shí)間不同時(shí),同時(shí)根據(jù)所述語(yǔ)音數(shù)據(jù)處理時(shí)間和所述語(yǔ)音數(shù)據(jù)處理自信度,從至少兩個(gè)所述語(yǔ)音識(shí)別引擎中選擇所述目標(biāo)識(shí)別引擎。
可選地,當(dāng)所述語(yǔ)音數(shù)據(jù)處理時(shí)間相同時(shí),直接根據(jù)所述語(yǔ)音數(shù)據(jù)處理自信度,從至少兩個(gè)所述語(yǔ)音識(shí)別引擎中選擇所述目標(biāo)識(shí)別引擎,包括:確定語(yǔ)音數(shù)據(jù)處理自信度符合預(yù)設(shè)自信度閾值的語(yǔ)音識(shí)別引擎作為所述目標(biāo)識(shí)別引擎。
可選地,當(dāng)所述語(yǔ)音數(shù)據(jù)處理自信度符合所述預(yù)設(shè)自信度閾值的語(yǔ)音識(shí)別引擎的數(shù)量包括至少兩個(gè)時(shí),選擇語(yǔ)音數(shù)據(jù)處理自信度最高的語(yǔ)音識(shí)別引擎作為所述目標(biāo)識(shí)別引擎。
可選地,當(dāng)至少兩個(gè)語(yǔ)音識(shí)別引擎中,未獲取到語(yǔ)音數(shù)據(jù)處理自信度符合預(yù)設(shè)自信度閾值的語(yǔ)音識(shí)別引擎時(shí),則確定目標(biāo)語(yǔ)音識(shí)別引擎選取失敗;選取語(yǔ)音數(shù)據(jù)處理自信度最高的語(yǔ)音識(shí)別引擎,用以完成所述場(chǎng)景下后續(xù)采集的所述語(yǔ)音數(shù)據(jù)進(jìn)行語(yǔ)義識(shí)別處理。
可選地,當(dāng)所述語(yǔ)音數(shù)據(jù)處理時(shí)間不同時(shí),同時(shí)根據(jù)所述語(yǔ)音數(shù)據(jù)處理時(shí)間和所述語(yǔ)音數(shù)據(jù)處理自信度,從至少兩個(gè)所述語(yǔ)音識(shí)別引擎中選擇所述目標(biāo)識(shí)別引擎,包括:從語(yǔ)音數(shù)據(jù)處理自信度符合預(yù)設(shè)自信度閾值的語(yǔ)音識(shí)別引擎中,選取語(yǔ)音數(shù)據(jù)處理時(shí)間最短的語(yǔ)音識(shí)別引擎作為所述目標(biāo)識(shí)別引擎。
可選地,當(dāng)至少兩個(gè)所述語(yǔ)音識(shí)別引擎中,所有語(yǔ)音數(shù)據(jù)處理自信度均不符合預(yù)設(shè)自信度閾值時(shí),則確定目標(biāo)語(yǔ)音識(shí)別引擎選取失敗;選取語(yǔ)音數(shù)據(jù)處理自信度最高或者選取語(yǔ)音數(shù)據(jù)處理時(shí)間最短的語(yǔ)音識(shí)別引擎,用以完成所述場(chǎng)景下后續(xù)采集的所述語(yǔ)音數(shù)據(jù)進(jìn)行語(yǔ)義識(shí)別處理。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于南京四維智聯(lián)科技有限公司,未經(jīng)南京四維智聯(lián)科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210308958.1/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G10L 語(yǔ)音分析或合成;語(yǔ)音識(shí)別;音頻分析或處理
G10L15-00 語(yǔ)音識(shí)別
G10L15-02 .語(yǔ)音識(shí)別的特征提取;識(shí)別單位的選擇
G10L15-04 .分段或字極限檢測(cè)
G10L15-06 .創(chuàng)建基準(zhǔn)模板;訓(xùn)練語(yǔ)音識(shí)別系統(tǒng),例如對(duì)說(shuō)話(huà)者聲音特征的適應(yīng)
G10L15-08 .語(yǔ)音分類(lèi)或檢索
G10L15-20 .專(zhuān)門(mén)適用于不利環(huán)境
- 用于語(yǔ)音處理的方法與系統(tǒng)
- 一種語(yǔ)音識(shí)別測(cè)試系統(tǒng)及方法
- 用于語(yǔ)音識(shí)別的方法和裝置
- 一種語(yǔ)音消毒柜的控制方法及語(yǔ)音消毒柜
- 一種語(yǔ)音處理方法及裝置
- 混合語(yǔ)音識(shí)別方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 語(yǔ)音情緒識(shí)別方法、系統(tǒng)、移動(dòng)終端及存儲(chǔ)介質(zhì)
- 一種具有語(yǔ)音識(shí)別功能的智能語(yǔ)音終端設(shè)備
- 語(yǔ)音增強(qiáng)方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 一種聲紋鑒定語(yǔ)音重組方法和系統(tǒng)
- 識(shí)別媒體、識(shí)別媒體的識(shí)別方法、識(shí)別對(duì)象物品以及識(shí)別裝置
- 一種探針卡識(shí)別裝置和方法
- 識(shí)別裝置、識(shí)別方法以及記錄介質(zhì)
- 識(shí)別裝置、識(shí)別系統(tǒng),識(shí)別方法以及存儲(chǔ)介質(zhì)
- 識(shí)別程序、識(shí)別方法以及識(shí)別裝置
- 車(chē)載身份識(shí)別方法及系統(tǒng)
- 車(chē)載身份識(shí)別方法及系統(tǒng)
- 車(chē)載身份識(shí)別方法及系統(tǒng)
- 識(shí)別裝置、識(shí)別方法以及識(shí)別程序
- 識(shí)別裝置、識(shí)別方法及識(shí)別程序





