[發(fā)明專利]語音交互方法、裝置、設(shè)備和介質(zhì)在審

申請?zhí)枺?/td>	201910657252.4	申請日：	2019-07-19
公開（公告）號：	CN112242139A	公開（公告）日：	2021-01-19
發(fā)明（設(shè)計）人：	袁仁富	申請（專利權(quán)）人：	北京儒博科技有限公司
主分類號：	G10L15/22	分類號：	G10L15/22;G10L15/26;G09B5/04;G09B19/06
代理公司：	北京品源專利代理有限公司 11332	代理人：	孟金喆
地址：	101500 北京市密云區(qū)經(jīng)濟開發(fā)***	國省代碼：	北京;11
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	語音交互方法裝置設(shè)備介質(zhì)
鉆瓜網(wǎng) 技術(shù)展會專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【說明書】：

本發(fā)明實施例公開了一種語音交互方法、裝置、設(shè)備和介質(zhì)。所述方法包括：如果在預(yù)設(shè)時間內(nèi)檢測到用戶語音，則實時識別在初始拾音時間內(nèi)獲取的用戶語音；如果在初始拾音時間內(nèi)獲取的用戶語音的識別結(jié)果與預(yù)設(shè)候選語句的匹配結(jié)果不滿足匹配要求，則根據(jù)匹配結(jié)果與延時閾值的關(guān)系，在初始拾音時間的基礎(chǔ)上，進行拾音時間延長；將在延長拾音時間內(nèi)獲取的用戶語音的識別結(jié)果與在初始拾音時間內(nèi)獲取的用戶語音的識別結(jié)果進行整合；如果整合后的語音識別結(jié)果與預(yù)設(shè)候選語句的匹配結(jié)果滿足匹配要求，則將與整合后的語音識別結(jié)果對應(yīng)的反饋信息反饋給用戶。本發(fā)明實施例實現(xiàn)了即使用戶語音出現(xiàn)磕絆，人機交互中也能完整獲取用戶語音，提高智能教學(xué)效果。

技術(shù)領(lǐng)域

本發(fā)明實施例涉及智能教育技術(shù)領(lǐng)域，尤其涉及一種語音交互方法、裝置、設(shè)備和介質(zhì)。

背景技術(shù)

AI(Artificial Intelligence，人工智能)是計算機科學(xué)的一個分支，它企圖了解智能的實質(zhì)，并生產(chǎn)出一種新的能以人類智能相似的方式做出反應(yīng)的智能機器，該領(lǐng)域的研究包括機器人、語言識別、圖像識別、自然語言處理和專家系統(tǒng)等。人工智能從誕生以來，理論和技術(shù)日益成熟，應(yīng)用領(lǐng)域也不斷擴大，智能教育機器人與學(xué)生之間進行AI互動對話式的教學(xué)已成為可能，例如，通過兒童英語教學(xué)機器人與兒童的交互，讓兒童學(xué)習(xí)英語。

然而，兒童在學(xué)習(xí)語言的時候，尤其是在學(xué)習(xí)非母語語言的初期，總是會存在說話磕磕絆絆的現(xiàn)象，如果按照現(xiàn)有技術(shù)中基于在設(shè)定拾音時間內(nèi)獲取的兒童語音進行人機交互，基于VAD(Voice Activity Detection，語音活動檢測)檢測技術(shù)可能會誤判兒童語音的結(jié)束點，容易導(dǎo)致人機交互過程中不能完整獲取兒童語音，導(dǎo)致智能教學(xué)效果較差。

發(fā)明內(nèi)容

本發(fā)明實施例提供一種語音交互方法、裝置、設(shè)備和介質(zhì)，以解決現(xiàn)有技術(shù)中基于在設(shè)定拾音時間內(nèi)獲取的兒童語音進行人機交互，容易導(dǎo)致人機交互過程中不能完整獲取兒童語音，導(dǎo)致智能教學(xué)效果較差的問題。

第一方面，本發(fā)明實施例提供了一種語音交互方法，所述方法包括：

如果在預(yù)設(shè)時間內(nèi)檢測到用戶語音，則觸發(fā)在初始拾音時間內(nèi)識別用戶語音的操作；

實時識別在所述初始拾音時間內(nèi)獲取的用戶語音；

如果在所述初始拾音時間內(nèi)獲取的用戶語音的識別結(jié)果與預(yù)設(shè)候選語句的匹配結(jié)果不滿足匹配要求，則根據(jù)所述匹配結(jié)果與延時閾值的關(guān)系，在所述初始拾音時間的基礎(chǔ)上，進行拾音時間延長；

將在延長拾音時間內(nèi)獲取的用戶語音的識別結(jié)果與在所述初始拾音時間內(nèi)獲取的用戶語音的識別結(jié)果進行整合，并將整合后的語音識別結(jié)果與所述預(yù)設(shè)候選語句進行匹配；

如果所述整合后的語音識別結(jié)果與所述預(yù)設(shè)候選語句的匹配結(jié)果滿足所述匹配要求，則將與所述整合后的語音識別結(jié)果對應(yīng)的反饋信息反饋給用戶。

第二方面，本發(fā)明實施例提供了一種語音交互裝置，所述裝置包括：

用戶語音識別觸發(fā)模塊，用于如果在預(yù)設(shè)時間內(nèi)檢測到用戶語音，則觸發(fā)在初始拾音時間內(nèi)識別用戶語音的操作；

用戶語音識別模塊，用于實時識別在所述初始拾音時間內(nèi)獲取的用戶語音；

拾音時間延長模塊，用于如果在所述初始拾音時間內(nèi)獲取的用戶語音的識別結(jié)果與預(yù)設(shè)候選語句的匹配結(jié)果不滿足匹配要求，則根據(jù)所述匹配結(jié)果與延時閾值的關(guān)系，在所述初始拾音時間的基礎(chǔ)上，進行拾音時間延長；

語句匹配模塊，用于將在延長拾音時間內(nèi)獲取的用戶語音的識別結(jié)果與在所述初始拾音時間內(nèi)獲取的用戶語音的識別結(jié)果進行整合，并將整合后的語音識別結(jié)果與所述預(yù)設(shè)候選語句進行匹配；

第一信息反饋模塊，用于如果所述整合后的語音識別結(jié)果與所述預(yù)設(shè)候選語句的匹配結(jié)果滿足所述匹配要求，則將與所述整合后的語音識別結(jié)果對應(yīng)的反饋信息反饋給用戶。

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京儒博科技有限公司，未經(jīng)北京儒博科技有限公司許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201910657252.4/2.html，轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

上一篇：一種物理上行控制信道的資源配置方法及裝置
下一篇：一種語音交互方法、裝置、終端設(shè)備及存儲介質(zhì)

同類專利

專利分類

G 物理

G10 樂器；聲學(xué)
G10L 語音分析或合成；語音識別；音頻分析或處理
G10L15-00 語音識別
G10L15-02 .語音識別的特征提取；識別單位的選擇
G10L15-04 .分段或字極限檢測
G10L15-06 .創(chuàng)建基準(zhǔn)模板；訓(xùn)練語音識別系統(tǒng)，例如對說話者聲音特征的適應(yīng)
G10L15-08 .語音分類或檢索
G10L15-20 .專門適用于不利環(huán)境

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書；

2、支持發(fā)明專利、實用新型專利、外觀設(shè)計專利（升級中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】