[發(fā)明專利]一種基于交互融合的情感對話生成方法及系統(tǒng)有效
| 申請?zhí)枺?/td> | 202110798849.8 | 申請日: | 2021-07-15 |
| 公開(公告)號: | CN113254625B | 公開(公告)日: | 2021-11-16 |
| 發(fā)明(設(shè)計)人: | 張賓;孫喜民;高亞斌;賈江凱;王帥;李慧超;劉丹;王明達 | 申請(專利權(quán))人: | 國網(wǎng)電子商務(wù)有限公司;國網(wǎng)電商科技有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/33;G06F16/35;G06F40/126;G06F40/242;G06N3/04;G06N3/08 |
| 代理公司: | 成都華復(fù)知識產(chǎn)權(quán)代理有限公司 51298 | 代理人: | 龐啟成 |
| 地址: | 100053 北京市*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 交互 融合 情感 對話 生成 方法 系統(tǒng) | ||
本發(fā)明公開了一種基于交互融合的情感對話生成方法及系統(tǒng),包括:S100:接收對話語句文本;S200:情感分類器識別對話語句文本所蘊含的情感類別,并表示為向量;S300:編碼器將對話語句文本編碼為上下文向量;S400:細(xì)粒度交互模塊將對話語句文本的情感類別表示向量和上下文向量融合,生成交互式向量;S500:解碼器利用交互式向量進行解碼,生成回復(fù);S600:輸出回復(fù)。本發(fā)明可解決現(xiàn)有人機對話系統(tǒng)情感感知能力較弱,情感表達能力不足的問題。
技術(shù)領(lǐng)域
本發(fā)明屬于自然語言處理中的智能人機對話技術(shù)領(lǐng)域,具體涉及一種基于交互融合的情感對話生成方法及系統(tǒng)。
背景技術(shù)
構(gòu)建智能人機對話系統(tǒng)是自然語言處理(NLP)中一項極具挑戰(zhàn)性和重要意義的任務(wù),目前被學(xué)術(shù)界和工業(yè)界廣泛關(guān)注。情感是人類區(qū)別于機器的一種重要特征,在社交場景中發(fā)揮著重要作用。例如在醫(yī)療保健領(lǐng)域,情感預(yù)測可用于心理健康咨詢,幫助預(yù)測和預(yù)防自殺或抑郁。有研究表明,在對話系統(tǒng)中處理情感可以提高用戶滿意度,并減少對話故障的發(fā)生。讓機器理解情感一直是人工智能的一個長期目標(biāo)。
現(xiàn)有的相關(guān)技術(shù)普遍存在三方面問題:(1)生成回復(fù)的情感類別需提前指定,這不符合實際情況。日常生活中,對話發(fā)起者不會在說話的同時告訴應(yīng)答者希望得到的回復(fù)情感。(2)將內(nèi)容與情感獨立進行編碼,但內(nèi)容與情感間的依賴不足。(3)由于缺乏對生成過程的有效控制,模型容易生成諸如“yes”、“no”、“I don’t know”、“I’m not sure”等安全回復(fù)問題。以上問題導(dǎo)致對話模型的情感感知能力較弱并且情感表達能力不足。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種基于交互融合的情感對話生成方法及系統(tǒng),以解決現(xiàn)有人機對話系統(tǒng)情感感知能力較弱、情感表達能力不足的問題。
本發(fā)明實施例提供一種基于交互融合的情感對話生成方法,包括:
S100:接收對話語句文本;
S200:情感分類器識別對話語句文本所蘊含的情感類別,并表示為向量;
S300:編碼器將對話語句文本編碼為上下文向量;
S400:細(xì)粒度交互模塊將對話語句文本的情感類別表示向量和上下文向量融合,生成交互式向量;
本步驟進一步包括:
S410:將情感類別表示向量映射到高維的向量空間;
S420:根據(jù)注意力機制,基于情感類別表示向量和上下文向量,學(xué)習(xí)情感類別表示向量每一維的權(quán)重;
S430:對情感類別表示向量的每一維乘以相應(yīng)權(quán)重,再與上下文向量拼接,得交互式向量;
S500:解碼器利用交互式向量進行解碼,生成回復(fù);
S600:輸出回復(fù)。
可選的,在一些實施例中,情感分類器采用基于BERT的情感分類器。
可選的,在一些實施例中,步驟S300具體為:
編碼器將對話語句文本編碼成隱藏狀態(tài)序列;利用注意力機制對隱藏狀態(tài)序列中各隱藏狀態(tài)求加權(quán)和,得上下文向量。
可選的,在一些實施例中,解碼器采用單向LSTM神經(jīng)網(wǎng)絡(luò)。
可選的,在一些實施例中,步驟S500中,解碼器的總損失函數(shù)為Seq2Seq模型損失和最大化情感表達損失的加權(quán)和:;其中:權(quán)重是待學(xué)習(xí)參數(shù),為Seq2Seq模型的參數(shù);最大化情感表達損失,表示Seq2Seq模型的損失,通過懲罰生成詞的情感表示與中性情感詞之間的距離,為生成詞的情感表示,當(dāng)為VAD詞典中存在的詞,則其情感表示為;否則,其情感表示為。
可選的,在一些實施例中,采用情感分類數(shù)據(jù)集訓(xùn)練情感分類器;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于國網(wǎng)電子商務(wù)有限公司;國網(wǎng)電商科技有限公司,未經(jīng)國網(wǎng)電子商務(wù)有限公司;國網(wǎng)電商科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110798849.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





