[發明專利]一種針對多人多輪對話場景的對話圖重構方法及系統有效
| 申請號: | 202110048867.4 | 申請日: | 2021-01-14 |
| 公開(公告)號: | CN112765978B | 公開(公告)日: | 2023-03-31 |
| 發明(設計)人: | 權小軍;謝智賢 | 申請(專利權)人: | 中山大學 |
| 主分類號: | G06F40/289 | 分類號: | G06F40/289;G06F40/126;G06N3/049;G06F16/901 |
| 代理公司: | 深圳市創富知識產權代理有限公司 44367 | 代理人: | 高冰 |
| 地址: | 510275 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 針對 多人多 輪對 場景 對話 圖重構 方法 系統 | ||
1.一種針對多人多輪對話場景的對話圖重構方法,其特征在于,包括以下步驟:
獲取多人多輪對話數據并將多人多輪對話數據輸入到預構建的模型;
對多人多輪對話數據進行預處理,得到預處理后的對話;
對預處理后的對話進行編碼,得到句子向量和詞向量;
根據說話者特征信息和預設規則構建先驗圖;
基于預訓練網絡根據句子向量和詞向量獲取句子間的相關程度并構建自適應圖;
所述自適應圖的構建公式如下;
上式中,Wa為可學習參數,xi表示句子向量,表示對句子向量xj轉置,i、j表示構建得到的自適應圖中第i行第j列的值;
將先驗圖和自適應圖結合,得到重構的對話圖;
根據重構的對話圖得到輸出結果。
2.根據權利要求1所述一種針對多人多輪對話場景的對話圖重構方法,其特征在于,還包括:
計算模型損失并回傳,更新模型參數。
3.根據權利要求2所述一種針對多人多輪對話場景的對話圖重構方法,其特征在于,所述對多人多輪對話數據進行預處理,得到預處理后的對話這一步驟,其具體包括:
將多人多輪對話數據劃分為說話者特征信息、對話內容信息和監督信息;
對對話內容信息進行分詞、補全和階段預處理,得到預處理后的對話。
4.根據權利要求3所述一種針對多人多輪對話場景的對話圖重構方法,其特征在于,所述對對話內容信息進行分詞、補全和階段預處理,得到預處理后的對話這一步驟,其具體包括:
基于分詞工具將對話內容信息中的每句話進行分詞;
將對話內容信息中不在詞表里的詞轉換成第一特殊標記;
對對話內容信息中長度超過第一預設長度的句子進行截斷;
對對話內容信息中長度不超過第二預設長度的句子用第二特殊標記補全;
得到預處理后的對話。
5.根據權利要求4所述一種針對多人多輪對話場景的對話圖重構方法,其特征在于,所述對預處理后的對話進行編碼,得到句子向量和詞向量這一步驟,其具體包括:
將預處理后的對話經過雙向LSTM層,查表得到n*k矩陣和詞向量;
基于注意力層將n*k矩陣轉換成句子向量。
6.根據權利要求5所述一種針對多人多輪對話場景的對話圖重構方法,其特征在于,所述先驗圖、自適應圖和重構的對話圖為形狀相同的鄰接矩陣。
7.根據權利要求6所述一種針對多人多輪對話場景的對話圖重構方法,其特征在于,所述重構的對話圖的計算公式如下:
Ai=norm(ReLU(β*prior_graph(gi)+(1-β)*adaptive_graph(gi))),i=0,1,...,T
上式中,β是數值范圍為[0,1]的超參數,prior_graph(·)為獲取先驗圖的操作,adaptive_graph(·)為獲取自適應圖的操作,ReLU是激活函數,norm是歸一化操作。
8.一種針對多人多輪對話場景的對話圖重構系統,其特征在于,包括:
輸入模塊,用于獲取多人多輪對話數據并將多人多輪對話數據輸入到預構建的模型;
預處理模塊,用于對多人多輪對話數據進行預處理,得到預處理后的對話;
編碼模塊,用于對預處理后的對話進行編碼,得到句子向量和詞向量;
對話圖重構模塊,用于根據說話者特征信息和預設規則構建先驗圖;基于預訓練網絡根據句子向量和詞向量獲取句子間的相關程度并構建自適應圖;所述自適應圖的構建公式如下;上式中,Wa為可學習參數,xi表示句子向量,/表示對句子向量xj轉置,i、j表示構建得到的自適應圖中第i行第j列的值;將先驗圖和自適應圖結合,得到重構的對話圖;
輸出模塊,用于根據重構的對話圖得到輸出結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中山大學,未經中山大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110048867.4/1.html,轉載請聲明來源鉆瓜專利網。





