[發明專利]基于情感詞典和詞概率分布的情感會話生成方法在審
| 申請號: | 201910025929.2 | 申請日: | 2019-01-11 |
| 公開(公告)號: | CN109800295A | 公開(公告)日: | 2019-05-24 |
| 發明(設計)人: | 馬廷淮;楊慧敏 | 申請(專利權)人: | 南京信息工程大學 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/36 |
| 代理公司: | 南京鐘山專利代理有限公司 32252 | 代理人: | 戴朝榮 |
| 地址: | 210044 江蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 句子 情感詞 會話 單詞 概率分布 情感詞典 輸入句子 通用詞 嵌入 解碼器 解碼器框架 建立會話 情感表達 損失函數 狀態計算 編碼器 滿意度 相似度 概率 預設 語法 平衡 | ||
本發明公開了一種基于情感詞典和詞概率分布的情感會話生成方法,包括:對生成句子中的單詞進行情感詞嵌入;將情感詞嵌入輸入到編碼器?解碼器框架中,利用解碼器的狀態計算所述生成句子中下一個單詞分別對應于情感詞和通用詞的生成概率;根據預設的規則將情感詞和通用詞的生成概率進行連接,建立會話模型,得到生成句子中的下一個單詞;計算輸入句子和生成句子中已生成部分的情感相似度,采用情感損失函數對會話模型進行訓練,以使生成的句子與輸入句子的情感偏差小于設定偏差閾值。本發明提出一種在生成句子時考慮情感的方法,平衡了生成句子時的語法通順性和情感表達,提高了會話生成的效率和滿意度。
技術領域
本發明涉及數據挖掘技術領域,具體而言涉及一種基于情感詞典和詞概率分布的情感會話生成方法。
背景技術
由于智能手機的普及、寬帶無線技術的發展,現在我們處于社交媒體時代,更多的人以數據方式互相聯結,機器會話生成發展成一種社交方式就很自然了。早先的交互系統,如Eliza(Weizenbaum,1966)、Parry(Colby,1975)和Alice(Wallace,2009)都是以模仿人類行為為方向設計的文本會話生成,在控制范圍內通過了圖靈測試(Turing,1950;Shieber,1994)。盡管取得了令人印象深刻的成功,這些當前會話生成的前身主要還是基于手工定制的規則運行的。所以,它們只能在有限的環境中有良好的性能。
現如今,會話生成與用于閑聊的早期聊天機器人不同,它們的目的是滿足用戶的交流、情感和社交歸屬感需求(Maslow,1943),而不是為了通過圖靈測試。人工智能(AI)的一項基本挑戰就是賦予機器使用自然語言與人交流的能力。會話系統的主要目標不一定是解決用戶可能會有的所有問題,而是成為用戶的虛擬伙伴,通過與用戶建立情感聯系,會話系統可以更好地理解用戶,并在長期時間范圍內幫助他們。因此,會話系統必須能夠識別情緒、跟蹤對話中的情緒變化。
在會話系統中引入情感存在兩個主要的開放性問題:
第一個問題是因為情感注釋是一個相對主觀的任務,而且情感分類也很具有挑戰性。在大型語料庫中,高質量的情感標簽很難獲得。
第二個問題是因為需要平衡生成句子的語法通順性和情感表達,所以很難以一種自然而連貫的方式去考慮情感。在現有的神經模型中簡單的嵌入情感只會產生令人難以理解的表達,很難產生令人滿意的回答。
發明內容
本發明目的在于提供一種基于情感詞典和詞概率分布的情感會話生成方法,通過將傳統的詞嵌入與外部情感詞典相結合,實現情感詞嵌入來捕捉輸入句子中的情感,利用情感詞嵌入,結合編碼器-解碼器框架,對情感詞和普通詞分配不同的概率來模擬情感的表達,再根據不同的詞概率分布進行采樣來生成下一個單詞;另外,本發明還提出通過情感損失函數對模型進行訓練,以使生成句子與輸入句子情感更為貼合;本發明提出在生成句子時考慮情感的方法,平衡了生成句子時的語法通順性和情感表達,提高了會話生成的效率和滿意度。
為達成上述目的,結合圖1,本發明提出一種基于情感詞典和詞概率分布的情感會話生成方法,所述方法包括:
S1:對生成句子中的單詞進行情感詞嵌入,包括利用具有3D情感空間的外部詞典將所述單詞轉化為情感向量,再將轉換生成的情感向量與傳統詞嵌入相結合以完成情感詞嵌入;
S2:將從步驟S1中得到的情感詞嵌入輸入到編碼器-解碼器框架中,利用解碼器的狀態計算所述生成句子中下一個單詞分別對應于情感詞和通用詞的生成概率;
S3:針對情感詞和通用詞的生成概率設置對應的權重,根據預設的規則將步驟S2中得到的情感詞和通用詞的生成概率進行連接,建立會話模型P(yt),得到生成句子中的下一個單詞;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京信息工程大學,未經南京信息工程大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910025929.2/2.html,轉載請聲明來源鉆瓜專利網。





