[發(fā)明專利]連續(xù)喚醒識(shí)別功能的優(yōu)化方法和裝置有效
| 申請(qǐng)?zhí)枺?/td> | 201911379635.6 | 申請(qǐng)日: | 2019-12-27 |
| 公開(kāi)(公告)號(hào): | CN111128166B | 公開(kāi)(公告)日: | 2022-11-25 |
| 發(fā)明(設(shè)計(jì))人: | 李路天;甘津瑞 | 申請(qǐng)(專利權(quán))人: | 思必馳科技股份有限公司 |
| 主分類號(hào): | G10L15/22 | 分類號(hào): | G10L15/22;G10L15/26;G10L15/30;G10L25/78;H04L67/5683 |
| 代理公司: | 北京商專永信知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11400 | 代理人: | 黃謙;鄧婷婷 |
| 地址: | 215123 江蘇省蘇州市蘇*** | 國(guó)省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 連續(xù) 喚醒 識(shí)別 功能 優(yōu)化 方法 裝置 | ||
本發(fā)明公開(kāi)連續(xù)喚醒識(shí)別功能的優(yōu)化方法和裝置,其中,方法包括:持續(xù)接收音頻直至檢測(cè)到喚醒詞;對(duì)包含喚醒詞的音頻進(jìn)行語(yǔ)音識(shí)別以形成第一語(yǔ)音識(shí)別結(jié)果,并在預(yù)設(shè)時(shí)間內(nèi)緩存第一音頻之后接收的第二音頻;判斷第一語(yǔ)音識(shí)別結(jié)果中是否包含除喚醒詞外的語(yǔ)音;若第一語(yǔ)音識(shí)別結(jié)果中不包含除喚醒詞外的語(yǔ)音,判斷對(duì)于所述第二音頻的語(yǔ)音活性檢測(cè)是否超時(shí);若語(yǔ)音活性檢測(cè)未超時(shí),對(duì)第二音頻進(jìn)行語(yǔ)音識(shí)別以形成第二語(yǔ)音識(shí)別結(jié)果;若第二語(yǔ)音識(shí)別結(jié)果中包含除喚醒詞外的語(yǔ)音,回調(diào)第二語(yǔ)音識(shí)別結(jié)果。本申請(qǐng)的方法和裝置提供的方案可以對(duì)現(xiàn)有的連續(xù)喚醒識(shí)別功能進(jìn)行優(yōu)化,用戶體驗(yàn)更好。
技術(shù)領(lǐng)域
本發(fā)明屬于語(yǔ)音喚醒識(shí)別技術(shù)領(lǐng)域,尤其涉及連續(xù)喚醒識(shí)別功能的優(yōu)化方法和裝置。
背景技術(shù)
相關(guān)技術(shù)中,OneShot即一語(yǔ)即達(dá),通俗點(diǎn)可以稱之為“一把說(shuō)”,采用“喚醒詞+語(yǔ)音語(yǔ)義識(shí)別”一體化方式,實(shí)現(xiàn)喚醒詞與語(yǔ)音操控之間零間隔、零延遲、無(wú)縫對(duì)接,摒棄傳統(tǒng)的一問(wèn)一答的形式,極大減少用戶語(yǔ)音操控的步驟,實(shí)現(xiàn)信息反饋,化繁為簡(jiǎn),實(shí)現(xiàn)簡(jiǎn)便操作,但這樣的簡(jiǎn)便在設(shè)計(jì)之初卻并不簡(jiǎn)單。
OneShot的一大特點(diǎn)是識(shí)別喚醒與語(yǔ)義理解一體化,保證語(yǔ)音交互的統(tǒng)一性與連貫性,完成操控。也就是說(shuō),用戶可以直接下達(dá)指令,而不需要像過(guò)去的語(yǔ)音交互方式必須要一問(wèn)一答才能開(kāi)始交互。OneShot功能可以一語(yǔ)即中,實(shí)現(xiàn)“喚醒詞+語(yǔ)音語(yǔ)義識(shí)別”一體化,相比較傳統(tǒng)的語(yǔ)音交互在效率上要高得多。
現(xiàn)有技術(shù)中類似OneShot的技術(shù)有某飛的“喚醒識(shí)別”和某度的“喚醒識(shí)別連續(xù)說(shuō)”。
發(fā)明人在實(shí)現(xiàn)本申請(qǐng)的過(guò)程中發(fā)現(xiàn)上述技術(shù)都沒(méi)有公開(kāi)對(duì)OneShot不足情況下的解決方案。并且雖然上述方案可在相對(duì)理想的語(yǔ)音環(huán)境下實(shí)現(xiàn)Oneshot功能,但是當(dāng)音頻出現(xiàn)以下情況時(shí)往往只能識(shí)別到喚醒詞而把命令詞丟棄了:
1)AEC(回聲消除)消除不干凈;
2)環(huán)境噪音大;
3)用戶說(shuō)得比較慢時(shí)使得喚醒詞和命令詞之間無(wú)聲時(shí)間過(guò)長(zhǎng)。
發(fā)明內(nèi)容
本發(fā)明實(shí)施例提供一種連續(xù)喚醒識(shí)別功能的優(yōu)化方法和裝置,用于至少解決上述技術(shù)問(wèn)題之一。
第一方面,本發(fā)明實(shí)施例提供一種連續(xù)喚醒識(shí)別功能的優(yōu)化方法,包括:持續(xù)接收音頻直至檢測(cè)到喚醒詞;對(duì)包含喚醒詞的音頻進(jìn)行語(yǔ)音識(shí)別以形成第一語(yǔ)音識(shí)別結(jié)果,并在預(yù)設(shè)時(shí)間內(nèi)繼續(xù)緩存所述第一音頻之后接收的第二音頻;判斷所述第一語(yǔ)音識(shí)別結(jié)果中是否包含除喚醒詞外的語(yǔ)音;若所述第一語(yǔ)音識(shí)別結(jié)果中不包含除喚醒詞外的語(yǔ)音,判斷對(duì)于所述第二音頻的語(yǔ)音活性檢測(cè)是否超時(shí);若所述語(yǔ)音活性檢測(cè)未超時(shí),對(duì)所述第二音頻進(jìn)行語(yǔ)音識(shí)別以形成第二語(yǔ)音識(shí)別結(jié)果;以及若所述第二語(yǔ)音識(shí)別結(jié)果中包含除喚醒詞外的語(yǔ)音,回調(diào)所述第二語(yǔ)音識(shí)別結(jié)果。
第二方面,本發(fā)明實(shí)施例提供一種連續(xù)喚醒識(shí)別功能的優(yōu)化裝置,包括:?jiǎn)拘褭z測(cè)模塊,配置為持續(xù)接收音頻直至檢測(cè)到喚醒詞;第一識(shí)別模塊,配置為對(duì)包含喚醒詞的音頻進(jìn)行語(yǔ)音識(shí)別以形成第一語(yǔ)音識(shí)別結(jié)果,并在預(yù)設(shè)時(shí)間內(nèi)繼續(xù)緩存第一音頻之后接收的第二音頻;識(shí)別判斷模塊,配置為判斷所述第一語(yǔ)音識(shí)別結(jié)果中是否包含除喚醒詞外的語(yǔ)音;超時(shí)判斷模塊,配置為若所述第一語(yǔ)音識(shí)別結(jié)果中不包含除喚醒詞外的語(yǔ)音,判斷對(duì)于所述第二音頻的語(yǔ)音活性檢測(cè)是否超時(shí);第二識(shí)別模塊,配置為若所述語(yǔ)音活性檢測(cè)未超時(shí),對(duì)所述第二音頻進(jìn)行語(yǔ)音識(shí)別以形成第二語(yǔ)音識(shí)別結(jié)果;以及回調(diào)模塊,配置為若所述第二語(yǔ)音識(shí)別結(jié)果中包含除喚醒詞外的語(yǔ)音,回調(diào)所述第二語(yǔ)音識(shí)別結(jié)果。
第三方面,提供一種電子設(shè)備,其包括:至少一個(gè)處理器,以及與所述至少一個(gè)處理器通信連接的存儲(chǔ)器,其中,所述存儲(chǔ)器存儲(chǔ)有可被所述至少一個(gè)處理器執(zhí)行的指令,所述指令被所述至少一個(gè)處理器執(zhí)行,以使所述至少一個(gè)處理器能夠執(zhí)行本發(fā)明任一實(shí)施例的連續(xù)喚醒識(shí)別功能的優(yōu)化方法的步驟。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于思必馳科技股份有限公司,未經(jīng)思必馳科技股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911379635.6/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 識(shí)別媒體、識(shí)別媒體的識(shí)別方法、識(shí)別對(duì)象物品以及識(shí)別裝置
- 一種探針卡識(shí)別裝置和方法
- 識(shí)別裝置、識(shí)別方法以及記錄介質(zhì)
- 識(shí)別裝置、識(shí)別系統(tǒng),識(shí)別方法以及存儲(chǔ)介質(zhì)
- 識(shí)別程序、識(shí)別方法以及識(shí)別裝置
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 識(shí)別裝置、識(shí)別方法以及識(shí)別程序
- 識(shí)別裝置、識(shí)別方法及識(shí)別程序





