[發明專利]基于角色融合的人機交互對話方法及系統在審
| 申請號: | 202211279953.7 | 申請日: | 2022-10-19 |
| 公開(公告)號: | CN115563260A | 公開(公告)日: | 2023-01-03 |
| 發明(設計)人: | 朱振方;李嘉欣;董傳昊;徐富永;劉培玉 | 申請(專利權)人: | 山東師范大學 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/33;G06F16/335;G06N3/04 |
| 代理公司: | 濟南圣達知識產權代理有限公司 37221 | 代理人: | 閆圣娟 |
| 地址: | 250014 山*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 角色 融合 人機交互 對話 方法 系統 | ||
本公開涉及自然語言處理和深度學習技術領域,提出了一種基于角色融合的人機交互對話方法及系統,利用預定義的角色信息和查詢語句設計了一個角色感知網絡,來捕捉細粒度的個性化特征;建立了一個通用生成網絡,該網絡模型從角色感知網絡中的映射關系中生成通用的回復;最后構建了一致性匹配網絡,以便在角色和通用回復之間進行匹配。由于一致性匹配網絡獨立于查詢,采用NLI數據來生成個性化響應。還應用非似然訓練來最小化模型中的不一致概率,使預測更接近相關訓練目標,使模型生成的回復更加具有個性和多樣性。
技術領域
本公開涉及自然語言處理和深度學習相關技術領域,具體的說,是涉及一種基于角色融合的人機交互對話方法及系統。
背景技術
本部分的陳述僅僅是提供了與本公開相關的背景技術信息,并不必然構成在先技術。
對話系統受到了研究人員的大量關注,并且應用在各種行業場景中,尤其聊天機器人、智能助手等人工智能的提升將對話系統的研究推向了高潮。從以往研究中涉及的領域來看,現有的研究可分為兩個主要方向,即特定任務領域和開放領域。特定領域的模型致力于解決垂直領域業務助理系統,具有明確需要完成的任務目標,如餐廳預訂、商品購買等問題。而開放領域的對話系統涉及了無限的主題,適應于多種場景下的閑聊。目前可用對話數據集的爆炸式增長,構建開放領域對話系統吸引了越來越多的學者進行研究。
同時,知識工程的缺乏也使得構建一個開放領域的對話系統更具有挑戰性。在開放領域的對話系統中,根據構建方法的不同包括:基于生成的對話系統和基于檢索方法的對話系統。其中,基于生成的方法是對用戶的查詢創建一個可行的響應,而基于檢索的方法是從候選響應中根據評分排序匹配一個最佳的方案。基于檢索的方法所生成的句子雖然連貫性較好,但由于候選響應的限制,使得所檢索的句子樣式單一。相比之下,基于生成的對話系統能夠生成具有多樣性的回答,能夠靈活應對不同的對話場景。在生成式對話系統中,基于角色的開放域對話系統是一個研究的熱點問題,其任務是使對話生成的回復既能與給定的角色保持一致性,也能與對話上下文保持連貫性。
基于角色的對話系統融合預定義的角色信息,以產生更多樣和有意義的反應。預定義的角色信息包括各種個人身份特征或背景。近年來對基于人物角色的對話系統的研究主要集中在兩個方面:挖掘隱式角色和提取顯式角色。挖掘隱式角色的模型傳遞用戶ID嵌入向量來捕捉說話者的隱式身份;然而,個性化信息是由用戶的實值向量來表示的,這導致了角色無法解釋。此外,該方法還會受到噪聲干擾。因此,更多的研究被轉移到提取顯式角色上。在顯式角色模型中,早期的研究人員使用sequence to sequence的方法來編碼個人角色檔案。隨著個性化數據集的提出,個性化對話的工作主要集中在一種數據驅動的方法來學習相關特征。后來,Transformer展示了其文本處理的優勢,這使大規模的預訓練模型被應用于基于人物角色的對話系統中。
預訓練模型需要構建個性化的對話數據集,Persona-Chat是一個帶注釋的,專門用于解決角色不一致的對話任務的數據集。在這樣的人工數據集中,需要注釋者根據給定的角色進行模擬會話。這導致了人工數據集具有三方面的局限性:第一,建立人工數據集會消耗巨大的成本和人力,這無疑會導致人工數據集的短缺。第二,對話中涉及到大量的角色信息,這些數據被稱為密集型角色。從這樣的數據集訓練出來的模型會過度關注角色,這與現實脫離。最后,數據集由標注者有意的進行標記,不能充分反映其個性,會導致數據集偏差。例如,一個性格安靜的標注者很難模仿性格活潑的人的語言風格。因此,僅在角色密集的數據集上進行訓練并不能使模型完全理解其一致性。雖然人們曾經試圖在社交媒體上獲得更個性化的對話,但由于句子檢索僅限于啟發式規則,所獲得的數據也面臨著不能很好地反映一般用戶特征的問題。
可見,如果想提高模型的一致性理解能力,需要一個既能使模型生成高質量的響應,又能捕獲人物角色信息的數據集。然而,目前對這種數據集的注釋是非常困難的。
發明內容
本公開為了解決上述問題,提出了一種基于角色融合的人機交互對話方法及系統,能夠使得生成的回復更加具有個性和多樣性。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于山東師范大學,未經山東師范大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211279953.7/2.html,轉載請聲明來源鉆瓜專利網。





