[發明專利]一種基于圖推理模型的答案預測方法及裝置在審
| 申請號: | 202110353541.2 | 申請日: | 2021-04-01 |
| 公開(公告)號: | CN112732888A | 公開(公告)日: | 2021-04-30 |
| 發明(設計)人: | 趙翔;霍立軍;劉逸冰;葛斌;譚真;胡升澤;張翀;肖衛東 | 申請(專利權)人: | 中國人民解放軍國防科技大學 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/33;G06F40/126;G06F40/30 |
| 代理公司: | 長沙大珂知識產權代理事務所(普通合伙) 43236 | 代理人: | 伍志祥 |
| 地址: | 410073 湖*** | 國省代碼: | 湖南;43 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 推理 模型 答案 預測 方法 裝置 | ||
1.一種基于圖推理模型的答案預測方法,其特征在于,包括以下步驟:
步驟1,接收問題和支持文檔集和候選集,問題的形式為,其中,是實體對象,是實體對象和未知右實體之間的關系,所述未知右實體就是需要從候選集中選擇的答案;
步驟2,通過文本瘦身篩選掉支持文檔集中不相關的文檔,并對所有的文本進行語義編碼;
步驟3,使用多種注意力機制進行多種文本的語義交互和圖節點的初始化;
步驟4,基于構建的圖,使用圖神經網絡信息傳遞算法進行多跳推理;
步驟5,基于更新后的圖節點表示,為每個候選計算用于預測答案的分數;
步驟6,根據所述預測答案的分數分布結果,預測未知右實體;
步驟3中所述的圖節點的初始化包括以下步驟:
步驟301,通過實體抽取獲得所需的實體;
步驟302,把實體、候選、句子分別和問題進行語義交互以更新各自的向量表示;
步驟303,使用一層自注意力來獲取基于實體、候選和句子的圖節點初始表示。
2.根據權利要求1所述的一種基于圖推理模型的答案預測方法,其特征在于,步驟2中所述的文本瘦身是指,在問題的輔助下,使用兩層的TF-IDF算法挑選出相關文檔,包括以下步驟:
步驟201,在第一層TF-IDF算法中,計算支持文檔集中每個文檔和問題的TF-IDF余弦相似度并取出具有最大余弦相似度的文檔;
步驟202,在第二層TF-IDF算法中,計算上一層取出的文檔和所有剩下所有文檔的TF-IDF余弦相似度;
步驟203,根據所述余弦相似度的大小給所有文檔排序,取出前
步驟204,從支持文檔集取出的全部文檔組成新的支持文檔集,其中,表示第
3.根據權利要求2所述的一種基于圖推理模型的答案預測方法,其特征在于,步驟2中所述的語義編碼是指,使用預訓練的語言模型用作編碼器,將支持文檔集、問題和候選中的每個詞塊轉化為固定長度的向量,同時文本的語義也在這個過程被編碼并存儲在向量之中,包括以下步驟:
步驟205,給定一個編碼器,文檔集和問題通過如下公式被編碼:,,其中,返回編碼器對輸入變量編碼后的結果,,分別是文檔集和問題的序列表示,表示返回文本序列的長度,是編碼器隱狀態的維度,表示維度;
步驟206,取出候選在中對應的編碼,從而獲得的編碼表示,其中,為候選集中的任意一個候選,為候選的個數;
步驟207,把文檔劃分為句子,并取出中相應的向量用作句子的語義編碼;
步驟208,獲得基于句子的文檔集語義編碼,其中表示第
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國人民解放軍國防科技大學,未經中國人民解放軍國防科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110353541.2/1.html,轉載請聲明來源鉆瓜專利網。





