[發(fā)明專利]小樣本知識圖譜補全方法、系統(tǒng)、設備及存儲介質有效
| 申請?zhí)枺?/td> | 202210492838.1 | 申請日: | 2022-05-07 |
| 公開(公告)號: | CN114579769B | 公開(公告)日: | 2022-09-06 |
| 發(fā)明(設計)人: | 徐童;陳恩紅;羅鵬飛;朱熹 | 申請(專利權)人: | 中國科學技術大學 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F40/30;G06N3/04;G06N3/08 |
| 代理公司: | 北京凱特來知識產權代理有限公司 11260 | 代理人: | 鄭立明;韓珂 |
| 地址: | 230026 安*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 樣本 知識 圖譜 方法 系統(tǒng) 設備 存儲 介質 | ||
1.一種小樣本知識圖譜補全方法,其特征在于,包括:
從待補全的知識圖譜中提取出所有小樣本關系,對于每一小樣本關系分別提取出若干支撐三元組構成的支撐集,以及對于每一小樣本關系結合給定的若干詢問實體對構造若干詢問三元組,并提取出所有包含非小樣本關系的三元組作為背景知識圖譜;其中,小樣本關系出現的次數少于非小樣本關系,每一支撐三元組包含一個支撐實體對及支撐實體對的關系,所述支撐實體對與詢問實體對均包含頭尾兩個實體;
對于每一小樣本關系的每一詢問三元組,以及支撐集中的每一支撐三元組,均各自通過背景知識圖譜中分別提取出詢問實體對與支撐實體對的一跳鄰居集合,將詢問實體對與支撐實體對各自與對應的一跳鄰居集合進行語義交互建模,獲得每一詢問三元組中詢問實體對的隱向量與每一支撐三元組中支撐實體對的隱向量;
對于每一小樣本關系的每一詢問三元組,將相應詢問實體對的隱向量與對應支撐集的所有支撐三元組中支撐實體對的隱向量拼接后進行語義交互建模,獲得每一支撐三元組中支撐實體對的交互特征與詢問實體對的交互特征,再通過注意力機制計算出每一支撐三元組中支撐實體對的注意力權重,并對相應支撐實體對的隱向量進行加權,計算出支撐集的表示向量;通過支撐集的表示向量與詢問實體對的交互特征計算詢問實體對的評分;
對于具有相同詢問頭實體的詢問實體對,選出評分最高的詢問實體對對應的詢問三元組更新待補全的知識圖譜;
其中,所述對于每一小樣本關系的每一詢問三元組,以及支撐集中的每一支撐三元組,均各自通過背景知識圖譜中分別提取出詢問實體對與支撐實體對的一跳鄰居集合,將詢問實體對與支撐實體對各自與對應的一跳鄰居集合進行語義交互建模,獲得每一詢問三元組中詢問實體對的隱向量與每一支撐三元組中支撐實體對的隱向量包括:
對于每一詢問三元組,從背景知識圖譜中分別獲取詢問頭實體與詢問尾實體的所有一跳鄰居實體及相應的關系;對于支撐集中的每一支撐三元組,從背景知識圖譜中分別獲取支撐頭實體與支撐尾實體的所有一跳鄰居實體及相應的關系;對每個一跳鄰居實體與相應關系的嵌入表示進行融合編碼,作為每個一跳鄰居實體的融合表示向量,最終獲得詢問頭實體與詢問尾實體所有的一跳鄰居實體的融合表示向量,以及每一支撐三元組中支撐頭實體與支撐尾實體所有的一跳鄰居實體的融合表示向量;通過編碼相應小樣本關系,獲得關系向量,結合所述關系向量與相應實體的嵌入表示,獲得每一詢問三元組中詢問頭實體與詢問尾實體的表示向量,以及每一支撐三元組中支撐頭實體與支撐尾實體的表示向量;
將每一詢問三元組中詢問頭實體的表示向量及詢問尾實體的表示向量分別與對應的所有的一跳鄰居實體的融合表示向量進行拼接,則每一詢問實體對獲得兩組拼接向量;將每一支撐三元組中支撐頭實體的表示向量及支撐尾實體的表示向量分別與對應的所有的一跳鄰居實體的融合表示向量進行拼接,則每一支撐實體對獲得兩組拼接向量;
將每一詢問實體對的兩組拼接向量,以及每一支撐實體對的兩組拼接向量,均分別單獨通過Transformer模型進行語義交互建模,再融合兩組拼接向量的語義交互建模結果,獲得每一詢問三元組中詢問實體對的隱向量以及每一支撐三元組中支撐實體對的隱向量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學技術大學,未經中國科學技術大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210492838.1/1.html,轉載請聲明來源鉆瓜專利網。





