[發(fā)明專利]語音交互方法、裝置、設(shè)備和介質(zhì)在審
| 申請?zhí)枺?/td> | 201910657252.4 | 申請日: | 2019-07-19 |
| 公開(公告)號: | CN112242139A | 公開(公告)日: | 2021-01-19 |
| 發(fā)明(設(shè)計)人: | 袁仁富 | 申請(專利權(quán))人: | 北京儒博科技有限公司 |
| 主分類號: | G10L15/22 | 分類號: | G10L15/22;G10L15/26;G09B5/04;G09B19/06 |
| 代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 孟金喆 |
| 地址: | 101500 北京市密云區(qū)經(jīng)濟開發(fā)*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 語音 交互 方法 裝置 設(shè)備 介質(zhì) | ||
本發(fā)明實施例公開了一種語音交互方法、裝置、設(shè)備和介質(zhì)。所述方法包括:如果在預(yù)設(shè)時間內(nèi)檢測到用戶語音,則實時識別在初始拾音時間內(nèi)獲取的用戶語音;如果在初始拾音時間內(nèi)獲取的用戶語音的識別結(jié)果與預(yù)設(shè)候選語句的匹配結(jié)果不滿足匹配要求,則根據(jù)匹配結(jié)果與延時閾值的關(guān)系,在初始拾音時間的基礎(chǔ)上,進行拾音時間延長;將在延長拾音時間內(nèi)獲取的用戶語音的識別結(jié)果與在初始拾音時間內(nèi)獲取的用戶語音的識別結(jié)果進行整合;如果整合后的語音識別結(jié)果與預(yù)設(shè)候選語句的匹配結(jié)果滿足匹配要求,則將與整合后的語音識別結(jié)果對應(yīng)的反饋信息反饋給用戶。本發(fā)明實施例實現(xiàn)了即使用戶語音出現(xiàn)磕絆,人機交互中也能完整獲取用戶語音,提高智能教學(xué)效果。
技術(shù)領(lǐng)域
本發(fā)明實施例涉及智能教育技術(shù)領(lǐng)域,尤其涉及一種語音交互方法、裝置、設(shè)備和介質(zhì)。
背景技術(shù)
AI(Artificial Intelligence,人工智能)是計算機科學(xué)的一個分支,它企圖了解智能的實質(zhì),并生產(chǎn)出一種新的能以人類智能相似的方式做出反應(yīng)的智能機器,該領(lǐng)域的研究包括機器人、語言識別、圖像識別、自然語言處理和專家系統(tǒng)等。人工智能從誕生以來,理論和技術(shù)日益成熟,應(yīng)用領(lǐng)域也不斷擴大,智能教育機器人與學(xué)生之間進行AI互動對話式的教學(xué)已成為可能,例如,通過兒童英語教學(xué)機器人與兒童的交互,讓兒童學(xué)習(xí)英語。
然而,兒童在學(xué)習(xí)語言的時候,尤其是在學(xué)習(xí)非母語語言的初期,總是會存在說話磕磕絆絆的現(xiàn)象,如果按照現(xiàn)有技術(shù)中基于在設(shè)定拾音時間內(nèi)獲取的兒童語音進行人機交互,基于VAD(Voice Activity Detection,語音活動檢測)檢測技術(shù)可能會誤判兒童語音的結(jié)束點,容易導(dǎo)致人機交互過程中不能完整獲取兒童語音,導(dǎo)致智能教學(xué)效果較差。
發(fā)明內(nèi)容
本發(fā)明實施例提供一種語音交互方法、裝置、設(shè)備和介質(zhì),以解決現(xiàn)有技術(shù)中基于在設(shè)定拾音時間內(nèi)獲取的兒童語音進行人機交互,容易導(dǎo)致人機交互過程中不能完整獲取兒童語音,導(dǎo)致智能教學(xué)效果較差的問題。
第一方面,本發(fā)明實施例提供了一種語音交互方法,所述方法包括:
如果在預(yù)設(shè)時間內(nèi)檢測到用戶語音,則觸發(fā)在初始拾音時間內(nèi)識別用戶語音的操作;
實時識別在所述初始拾音時間內(nèi)獲取的用戶語音;
如果在所述初始拾音時間內(nèi)獲取的用戶語音的識別結(jié)果與預(yù)設(shè)候選語句的匹配結(jié)果不滿足匹配要求,則根據(jù)所述匹配結(jié)果與延時閾值的關(guān)系,在所述初始拾音時間的基礎(chǔ)上,進行拾音時間延長;
將在延長拾音時間內(nèi)獲取的用戶語音的識別結(jié)果與在所述初始拾音時間內(nèi)獲取的用戶語音的識別結(jié)果進行整合,并將整合后的語音識別結(jié)果與所述預(yù)設(shè)候選語句進行匹配;
如果所述整合后的語音識別結(jié)果與所述預(yù)設(shè)候選語句的匹配結(jié)果滿足所述匹配要求,則將與所述整合后的語音識別結(jié)果對應(yīng)的反饋信息反饋給用戶。
第二方面,本發(fā)明實施例提供了一種語音交互裝置,所述裝置包括:
用戶語音識別觸發(fā)模塊,用于如果在預(yù)設(shè)時間內(nèi)檢測到用戶語音,則觸發(fā)在初始拾音時間內(nèi)識別用戶語音的操作;
用戶語音識別模塊,用于實時識別在所述初始拾音時間內(nèi)獲取的用戶語音;
拾音時間延長模塊,用于如果在所述初始拾音時間內(nèi)獲取的用戶語音的識別結(jié)果與預(yù)設(shè)候選語句的匹配結(jié)果不滿足匹配要求,則根據(jù)所述匹配結(jié)果與延時閾值的關(guān)系,在所述初始拾音時間的基礎(chǔ)上,進行拾音時間延長;
語句匹配模塊,用于將在延長拾音時間內(nèi)獲取的用戶語音的識別結(jié)果與在所述初始拾音時間內(nèi)獲取的用戶語音的識別結(jié)果進行整合,并將整合后的語音識別結(jié)果與所述預(yù)設(shè)候選語句進行匹配;
第一信息反饋模塊,用于如果所述整合后的語音識別結(jié)果與所述預(yù)設(shè)候選語句的匹配結(jié)果滿足所述匹配要求,則將與所述整合后的語音識別結(jié)果對應(yīng)的反饋信息反饋給用戶。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京儒博科技有限公司,未經(jīng)北京儒博科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910657252.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





