[發(fā)明專利]用于保持對話系統(tǒng)對話連貫性的方法及系統(tǒng)有效
| 申請?zhí)枺?/td> | 201611060135.2 | 申請日: | 2016-11-24 |
| 公開(公告)號: | CN106776828B | 公開(公告)日: | 2020-12-15 |
| 發(fā)明(設(shè)計)人: | 簡仁賢;王海波 | 申請(專利權(quán))人: | 竹間智能科技(上海)有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F40/289;G06F40/30 |
| 代理公司: | 北京酷愛智慧知識產(chǎn)權(quán)代理有限公司 11514 | 代理人: | 趙永輝 |
| 地址: | 200233 上海市浦東新區(qū)自由貿(mào)*** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 用于 保持 對話 系統(tǒng) 連貫性 方法 | ||
本發(fā)明提供一種用于保持對話系統(tǒng)對話連貫性的方法及系統(tǒng),其中,方法包括,根據(jù)當(dāng)前對話輸入,實時地從所有歷史對話中切割出與當(dāng)前對話屬于同一話題的相關(guān)話題集合;從相關(guān)話題集合中挖掘出當(dāng)前話題關(guān)鍵詞;根據(jù)當(dāng)前對話輸入和當(dāng)前話題關(guān)鍵詞,確定應(yīng)答輸出。本發(fā)明提供的用于保持對話系統(tǒng)對話連貫性的方法及系統(tǒng),根據(jù)當(dāng)前對話輸入的內(nèi)容,實時地從所有以往話題中切割出與當(dāng)前對話屬于同一話題的相關(guān)話題集合,并從切割出的相關(guān)話題集合中,挖掘出最具有代表性的當(dāng)前話題關(guān)鍵詞,由于所挖掘出的關(guān)鍵詞包含了上下文信息,將當(dāng)前對話輸入內(nèi)容與當(dāng)前話題關(guān)鍵詞一并作為系統(tǒng)輸入,可以保持對話系統(tǒng)對話連貫性,從而實現(xiàn)人機對話達到持續(xù)深入的效果。
技術(shù)領(lǐng)域
本發(fā)明涉及一種用于保持對話系統(tǒng)對話連貫性的方法及系統(tǒng)。
背景技術(shù)
在人機對話系統(tǒng)中,用戶和對話系統(tǒng)聊天的輪數(shù)是衡量該對話系統(tǒng)好壞的最直觀的指標(biāo)。為了提高用戶和對話系統(tǒng)聊天的輪數(shù),必須保障對話系統(tǒng)對話連貫性,一方面,在用戶討論的聊天主題下,對話系統(tǒng)需要盡可能在這個主題進行相關(guān)回復(fù),避免答非所問;另一方面:當(dāng)用戶切換到新的聊天主題時,對話系統(tǒng)也需要切換到新的聊天主題下。
現(xiàn)有技術(shù)中,較為常用的保持對話系統(tǒng)對話連貫性的方法為:獲取前面N輪的歷史對話,并從中提取出關(guān)鍵詞,然后將這些關(guān)鍵詞跟當(dāng)前用戶的對話輸入相結(jié)合,作為系統(tǒng)輸入,由于該方法中包含前N輪對話的關(guān)鍵詞信息,因而可以在一定程度上保持對話的連貫性。
但是,現(xiàn)有技術(shù)的缺陷在于:一方面,N的取值很難確定,如果取得過小,例如,N=1,那么只能包含前面一輪的歷史對話信息,因而容易受限于局部信息;如果取得過大,又可能會超出上下文的范圍,引入無關(guān)信息;另一方面,從N輪歷史對話中很有可能獲取過多的關(guān)鍵詞,當(dāng)相關(guān)度低甚至無關(guān)的關(guān)鍵詞被引入時會給對話系統(tǒng)帶來噪音,而且,無關(guān)的關(guān)鍵詞越多,噪音越大,會嚴重影響對話質(zhì)量。
發(fā)明內(nèi)容
本發(fā)明要解決的技術(shù)問題是提供一種用于保持對話系統(tǒng)對話連貫性的方法及系統(tǒng),根據(jù)當(dāng)前對話輸入的內(nèi)容,實時地從所有以往話題中切割出與當(dāng)前對話屬于同一話題的相關(guān)話題集合,并從切割出的相關(guān)話題集合中,挖掘出最具有代表性的當(dāng)前話題關(guān)鍵詞,由于所挖掘出的關(guān)鍵詞包含了上下文信息,將當(dāng)前對話輸入內(nèi)容與當(dāng)前話題關(guān)鍵詞一并作為系統(tǒng)輸入,可以保持對話系統(tǒng)對話連貫性,從而實現(xiàn)人機對話達到持續(xù)深入的效果。
為解決上述技術(shù)問題,本發(fā)明提供的技術(shù)方案是:
一方面,本發(fā)明提供一種用于保持對話系統(tǒng)對話連貫性的方法,包括,根據(jù)當(dāng)前對話輸入,實時地從所有歷史對話中切割出與當(dāng)前對話屬于同一話題的相關(guān)話題集合;從相關(guān)話題集合中挖掘出當(dāng)前話題關(guān)鍵詞;根據(jù)當(dāng)前對話輸入和當(dāng)前話題關(guān)鍵詞,確定應(yīng)答輸出。
進一步地,根據(jù)當(dāng)前對話輸入,實時地從所有歷史對話中切割出與當(dāng)前對話屬于同一話題的相關(guān)話題集合,具體包括,將當(dāng)前對話輸入標(biāo)記為Q0,并對歷史對話重新標(biāo)記,其中,歷史對話為[Q1,A1],[Q2,A2],…[Qi,Ai],…[Qn,An],重新標(biāo)記后的歷史對話為S1,S2,S3,S4,…,S2i-1,S2i,…S2n-1,S2n,其中,n為歷史對話的總數(shù)量,[Qi,Ai]為第i輪歷史對話,Qi為第i輪歷史對話中的對話輸入,Ai為第i輪歷史對話中的應(yīng)答輸出,S2i-1為Qi重新標(biāo)記后對應(yīng)的句子,S2i為Ai重新標(biāo)記后對應(yīng)的句子;根據(jù)當(dāng)前對話輸入和重新標(biāo)記后的歷史對話,按照預(yù)先設(shè)定的話題切割規(guī)則進行話題切割,以獲得所有歷史對話中與當(dāng)前對話輸入屬于同一話題的相關(guān)話題集合。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于竹間智能科技(上海)有限公司,未經(jīng)竹間智能科技(上海)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611060135.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





