[發(fā)明專利]人機對話打斷方法、電子設(shè)備及計算機可讀存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 202110761273.8 | 申請日: | 2021-07-06 |
| 公開(公告)號: | CN113488047A | 公開(公告)日: | 2021-10-08 |
| 發(fā)明(設(shè)計)人: | 葛付江;章鵬;于新明;董鑫;初敏 | 申請(專利權(quán))人: | 思必馳科技股份有限公司 |
| 主分類號: | G10L15/22 | 分類號: | G10L15/22;G10L15/18 |
| 代理公司: | 北京商專永信知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11400 | 代理人: | 黃謙;車江華 |
| 地址: | 215123 江蘇省蘇州市蘇*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 人機對話 打斷 方法 電子設(shè)備 計算機 可讀 存儲 介質(zhì) | ||
本發(fā)明公開一種人機對話打斷方法,應(yīng)用于電子設(shè)備,該方法包括:根據(jù)已經(jīng)完成的對話確定對話意圖空間;當檢測到新的對話語句時,根據(jù)所述新的對話語句確定新的對話意圖;至少當所述新的對話意圖屬于所述對話意圖空間時,確定對應(yīng)于所述新的對話意圖的答復內(nèi)容。本發(fā)明中當確定新的對話意圖屬于預(yù)先確定的對話意圖空間時,表明新的對話語句是與已經(jīng)完成的對話相關(guān)的,從而可以確定檢測到的該新的對話語句并非噪音,并對該新的對話語句做出響應(yīng),避免了在噪音對人機對話的誤打斷。
技術(shù)領(lǐng)域
本發(fā)明涉及人機對話技術(shù)領(lǐng)域,尤其涉及一種人機對話打斷方法、電子設(shè)備及計算機可讀存儲介質(zhì)。
背景技術(shù)
現(xiàn)有人機對話中,在電子設(shè)備為用戶播報的過程中可以同時監(jiān)聽是否存在語音,并根據(jù)監(jiān)聽結(jié)果確定是否打斷當前播報進行響應(yīng)。現(xiàn)有技術(shù)中通常采用的方法有:用語音的VAD(Voice Activity Detection)技術(shù)通過聲音信號的強弱或停頓時間來判斷用戶是否說話或說完;或者通過“拒識模型”來判斷用戶是否在說話。
其中,通過VAD判斷的方法在機器播報的同時,監(jiān)聽用戶的語音輸入,從語音層面判斷是否有聲音,如果有聲音就認為用戶在說話。
“拒識模型”分為兩種,一種通過訓練一個音頻的分類器,來判斷錄入聲音是否是背景噪音,比如周圍人的說話聲,拒識的功能就是把無效的語音過濾掉;另外一種是語義拒識:基于用戶當前說的話的文本和歷史說的話的文本,建立二分類的模型,通過模型學習是否拒識。這個思路有一個前提假設(shè),用戶“跟機器人說話”和“不是跟機器人說話”說的話的文本在語義空間上是不同的,本質(zhì)上是一個二分類的分類器。
然而,通過VAD拒識容易因為背景音或噪音導致機器停止播報;也容易因為用戶說話過程中有個短暫的停頓導致機器認為用戶說完了。語音拒識相當于加強的VAD,VAD判斷過程中加入了背景音、噪音等語音訓練的分類器。通過噪音的一些特征學習是否應(yīng)該拒識。但因為只使用聲音信號作為依據(jù),無法判斷用戶只是發(fā)出一些語氣詞還是真的要說話。另外無法判斷用戶是否真的說完了還是只是短暫停頓。
語義拒識現(xiàn)在的通常做法是訓練一個二分類的語義分類器,但這種方法有個假設(shè),用戶“跟機器人說話”和“不是跟機器人說話”說的話的文本在語義空間上是不同的。但實際用戶在和旁邊的人說話,或旁邊的人在聊天,他們說的話都是有意義的,這種方法很難做出正確的判斷。
發(fā)明內(nèi)容
本發(fā)明實施例提供一種人機對話打斷方法、電子設(shè)備及計算機可讀存儲介質(zhì),用于至少解決上述技術(shù)問題之一。
第一方面,本發(fā)明實施例提供一種人機對話打斷方法,應(yīng)用于電子設(shè)備,該方法包括:
根據(jù)已經(jīng)完成的對話確定對話意圖空間;
當檢測到新的對話語句時,根據(jù)所述新的對話語句確定新的對話意圖;
至少當所述新的對話意圖屬于所述對話意圖空間時,確定對應(yīng)于所述新的對話意圖的答復內(nèi)容。
第二方面,本發(fā)明實施例提供一種計算機可讀存儲介質(zhì),所述存儲介質(zhì)中存儲有一個或多個包括執(zhí)行指令的程序,所述執(zhí)行指令能夠被電子設(shè)備(包括但不限于計算機,服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)讀取并執(zhí)行,以用于執(zhí)行本發(fā)明上述任一項人機對話打斷方法。
第三方面,提供一種電子設(shè)備,其包括:至少一個處理器,以及與所述至少一個處理器通信連接的存儲器,其中,所述存儲器存儲有可被所述至少一個處理器執(zhí)行的指令,所述指令被所述至少一個處理器執(zhí)行,以使所述至少一個處理器能夠執(zhí)行本發(fā)明上述任一項人機對話打斷方法。
第四方面,本發(fā)明實施例還提供一種計算機程序產(chǎn)品,所述計算機程序產(chǎn)品包括存儲在存儲介質(zhì)上的計算機程序,所述計算機程序包括程序指令,當所述程序指令被計算機執(zhí)行時,使所述計算機執(zhí)行上述任一項人機對話打斷方法。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于思必馳科技股份有限公司,未經(jīng)思必馳科技股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110761273.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 網(wǎng)絡(luò)的人機對話平臺
- 人機對話方法、系統(tǒng)、電子設(shè)備及存儲介質(zhì)
- 任務(wù)型人機對話系統(tǒng)及其實現(xiàn)方法、裝置與電子設(shè)備
- 對話引導模型的訓練樣本構(gòu)建方法和生成模型的方法
- 人機對話及人機對話模型獲取方法、裝置及存儲介質(zhì)
- 一種基于人機對話的智能問答方法和裝置以及設(shè)備
- 智能機器人的人機對話數(shù)據(jù)處理方法及系統(tǒng)
- 智能機器人的人機對話流程自動切換方法及系統(tǒng)
- 人機對話數(shù)據(jù)處理方法、裝置、計算機設(shè)備和存儲介質(zhì)
- 一種英語人機對話系統(tǒng)及學習方法





