[發明專利]一種融入常識知識的生成式對話摘要方法有效
| 申請號: | 202011104023.9 | 申請日: | 2020-10-15 |
| 公開(公告)號: | CN112148863B | 公開(公告)日: | 2022-07-01 |
| 發明(設計)人: | 馮驍騁;馮夏沖;秦兵;劉挺 | 申請(專利權)人: | 哈爾濱工業大學 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F40/295;G06N3/04 |
| 代理公司: | 哈爾濱華夏松花江知識產權代理有限公司 23213 | 代理人: | 岳昕 |
| 地址: | 150001 黑龍*** | 國省代碼: | 黑龍江;23 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 融入 常識 知識 生成 對話 摘要 方法 | ||
1.一種融入常識知識的生成式對話摘要方法,其特征在于,包括:
步驟一、獲取常識知識庫ConceptNet與對話摘要數據集SAMSum;包含的常識知識以元組的形式存在,即元組知識,表示為:
R=(h,r,t,w),
其中,R表示一個元組知識;h表示頭實體;r表示關系;t表示尾實體;w表示權重,表示關系的置信度;知識R表示了頭實體h和尾實體t擁有關系r,并且權重為w;
所述對話摘要數據集SAMSum分為訓練、開發和測試三部分;
步驟二、利用獲取的常識知識庫ConceptNet為對話摘要數據集SAMSum引入元組知識,構建異構對話圖;具體過程為:
步驟三、構建對話異構神經網絡模型;所述對話異構神經網絡模型包括節點編碼器、圖編碼器和解碼器;
步驟三一、構造節點編碼器,利用雙向長短時神經網絡獲取節點初始化表示和詞語初始化表示
步驟三二、構造圖編碼器,利用異構圖神經網絡更新節點表示,并添加節點位置編碼信息和更新詞語表示
步驟三三、構造解碼器;
步驟四、訓練步驟三中構造的對話異構神經網絡模型,通過訓練的對話異構神經網絡模型從一段對話中生成最終對話摘要。
2.根據權利要求1所述一種融入常識知識的生成式對話摘要方法,其特征在于,所述步驟二利用獲取的常識知識庫ConceptNet為對話摘要數據集SAMSum引入元組知識,構建異構對話圖;具體過程為:
步驟二一、對于一段對話,根據對話中的詞語從ConceptNet中獲取的相關元組知識,排除噪音知識,得到與給定對話相關的元組知識集合;
步驟二二、對于步驟二一獲取到的相關元組知識中,假設存在句子A和句子B,詞語a屬于A,詞語b屬于B,簡化元組知識,如果a和b的尾實體h一致,那么將句子A和B連接到尾實體h;得到句子—知識圖;
步驟二三、根據“說話人說的一句話”建立說話人與句子之間的邊關系,得到說話人—句子圖;
步驟二四、將句子—知識圖和說話人—句子圖融合為異構對話圖;所述異構對話圖在說話人和句子之間存在兩種邊,即從說話人到句子的“speak-by”邊,從句子到說話人的“rev-speak-by”邊;在句子和元組知識之間存在兩種邊,即從知識到句子的“know-by”邊,從句子到元組知識的“rev-know-by”邊;異構對話圖存在三類節點,即說話人、句子和常識知識。
3.根據權利要求2所述一種融入常識知識的生成式對話摘要方法,其特征在于,所述步驟三一構造節點編碼器;利用雙向長短時神經網絡獲取節點初始化表示和詞語初始化表示具體過程為:
對于構造的異構對話圖,其中每一個節點vi包含|vi|個單詞,單詞序列為其中,wi,n表示節點vi的第n個單詞,n∈[1,|vi|];使用雙向長短時神經網絡對單詞序列生成前向隱層序列和后向隱層序列其中,前向隱層狀態后向隱層狀態xn為wi,n的詞向量表示;將前向隱層狀態的最后一個隱層表示與后向隱層狀態的第一個隱層表示拼接得到節點的初始化表示其中,;表示向量拼接;同時得到節點中每一個詞語的初始化表示
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于哈爾濱工業大學,未經哈爾濱工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011104023.9/1.html,轉載請聲明來源鉆瓜專利網。





