[發(fā)明專利]人機對話打斷方法、電子設(shè)備及計算機可讀存儲介質(zhì)在審

申請?zhí)枺?/td>	202110761273.8	申請日：	2021-07-06
公開（公告）號：	CN113488047A	公開（公告）日：	2021-10-08
發(fā)明（設(shè)計）人：	葛付江;章鵬;于新明;董鑫;初敏	申請（專利權(quán)）人：	思必馳科技股份有限公司
主分類號：	G10L15/22	分類號：	G10L15/22;G10L15/18
代理公司：	北京商專永信知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11400	代理人：	黃謙;車江華
地址：	215123 江蘇省蘇州市蘇***	國省代碼：	江蘇;32
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	人機對話打斷方法電子設(shè)備計算機可讀存儲介質(zhì)
鉆瓜網(wǎng) 技術(shù)展會專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【說明書】：

本發(fā)明公開一種人機對話打斷方法，應(yīng)用于電子設(shè)備，該方法包括：根據(jù)已經(jīng)完成的對話確定對話意圖空間；當檢測到新的對話語句時，根據(jù)所述新的對話語句確定新的對話意圖；至少當所述新的對話意圖屬于所述對話意圖空間時，確定對應(yīng)于所述新的對話意圖的答復內(nèi)容。本發(fā)明中當確定新的對話意圖屬于預(yù)先確定的對話意圖空間時，表明新的對話語句是與已經(jīng)完成的對話相關(guān)的，從而可以確定檢測到的該新的對話語句并非噪音，并對該新的對話語句做出響應(yīng)，避免了在噪音對人機對話的誤打斷。

技術(shù)領(lǐng)域

本發(fā)明涉及人機對話技術(shù)領(lǐng)域，尤其涉及一種人機對話打斷方法、電子設(shè)備及計算機可讀存儲介質(zhì)。

背景技術(shù)

現(xiàn)有人機對話中，在電子設(shè)備為用戶播報的過程中可以同時監(jiān)聽是否存在語音，并根據(jù)監(jiān)聽結(jié)果確定是否打斷當前播報進行響應(yīng)。現(xiàn)有技術(shù)中通常采用的方法有：用語音的VAD(Voice Activity Detection)技術(shù)通過聲音信號的強弱或停頓時間來判斷用戶是否說話或說完；或者通過“拒識模型”來判斷用戶是否在說話。

其中，通過VAD判斷的方法在機器播報的同時，監(jiān)聽用戶的語音輸入，從語音層面判斷是否有聲音，如果有聲音就認為用戶在說話。

“拒識模型”分為兩種，一種通過訓練一個音頻的分類器，來判斷錄入聲音是否是背景噪音，比如周圍人的說話聲，拒識的功能就是把無效的語音過濾掉；另外一種是語義拒識：基于用戶當前說的話的文本和歷史說的話的文本，建立二分類的模型，通過模型學習是否拒識。這個思路有一個前提假設(shè)，用戶“跟機器人說話”和“不是跟機器人說話”說的話的文本在語義空間上是不同的，本質(zhì)上是一個二分類的分類器。

然而，通過VAD拒識容易因為背景音或噪音導致機器停止播報；也容易因為用戶說話過程中有個短暫的停頓導致機器認為用戶說完了。語音拒識相當于加強的VAD，VAD判斷過程中加入了背景音、噪音等語音訓練的分類器。通過噪音的一些特征學習是否應(yīng)該拒識。但因為只使用聲音信號作為依據(jù)，無法判斷用戶只是發(fā)出一些語氣詞還是真的要說話。另外無法判斷用戶是否真的說完了還是只是短暫停頓。

語義拒識現(xiàn)在的通常做法是訓練一個二分類的語義分類器，但這種方法有個假設(shè)，用戶“跟機器人說話”和“不是跟機器人說話”說的話的文本在語義空間上是不同的。但實際用戶在和旁邊的人說話，或旁邊的人在聊天，他們說的話都是有意義的，這種方法很難做出正確的判斷。

發(fā)明內(nèi)容

本發(fā)明實施例提供一種人機對話打斷方法、電子設(shè)備及計算機可讀存儲介質(zhì)，用于至少解決上述技術(shù)問題之一。

第一方面，本發(fā)明實施例提供一種人機對話打斷方法，應(yīng)用于電子設(shè)備，該方法包括：

根據(jù)已經(jīng)完成的對話確定對話意圖空間；

當檢測到新的對話語句時，根據(jù)所述新的對話語句確定新的對話意圖；

至少當所述新的對話意圖屬于所述對話意圖空間時，確定對應(yīng)于所述新的對話意圖的答復內(nèi)容。

第二方面，本發(fā)明實施例提供一種計算機可讀存儲介質(zhì)，所述存儲介質(zhì)中存儲有一個或多個包括執(zhí)行指令的程序，所述執(zhí)行指令能夠被電子設(shè)備(包括但不限于計算機，服務(wù)器，或者網(wǎng)絡(luò)設(shè)備等)讀取并執(zhí)行，以用于執(zhí)行本發(fā)明上述任一項人機對話打斷方法。

第三方面，提供一種電子設(shè)備，其包括：至少一個處理器，以及與所述至少一個處理器通信連接的存儲器，其中，所述存儲器存儲有可被所述至少一個處理器執(zhí)行的指令，所述指令被所述至少一個處理器執(zhí)行，以使所述至少一個處理器能夠執(zhí)行本發(fā)明上述任一項人機對話打斷方法。

第四方面，本發(fā)明實施例還提供一種計算機程序產(chǎn)品，所述計算機程序產(chǎn)品包括存儲在存儲介質(zhì)上的計算機程序，所述計算機程序包括程序指令，當所述程序指令被計算機執(zhí)行時，使所述計算機執(zhí)行上述任一項人機對話打斷方法。

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于思必馳科技股份有限公司，未經(jīng)思必馳科技股份有限公司許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/202110761273.8/2.html，轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

上一篇：一種智能反射面反射系數(shù)與偏置電壓關(guān)系的測量方法
下一篇：語音點餐方法、裝置及系統(tǒng)

同類專利

專利分類

G 物理

G10 樂器；聲學
G10L 語音分析或合成；語音識別；音頻分析或處理
G10L15-00 語音識別
G10L15-02 .語音識別的特征提取；識別單位的選擇
G10L15-04 .分段或字極限檢測
G10L15-06 .創(chuàng)建基準模板；訓練語音識別系統(tǒng)，例如對說話者聲音特征的適應(yīng)
G10L15-08 .語音分類或檢索
G10L15-20 .專門適用于不利環(huán)境

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書；

2、支持發(fā)明專利、實用新型專利、外觀設(shè)計專利（升級中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】