[發明專利]知識庫實體對齊方法和裝置在審
| 申請號: | 202010104948.7 | 申請日: | 2020-02-20 |
| 公開(公告)號: | CN113282676A | 公開(公告)日: | 2021-08-20 |
| 發明(設計)人: | 李涓子;李成江;史佳欣;侯磊;張鵬;唐杰;許斌 | 申請(專利權)人: | 清華大學 |
| 主分類號: | G06F16/28 | 分類號: | G06F16/28;G06N3/04 |
| 代理公司: | 北京路浩知識產權代理有限公司 11002 | 代理人: | 馬瑞 |
| 地址: | 100084 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 知識庫 實體 對齊 方法 裝置 | ||
1.一種知識庫實體對齊方法,其特征在于,包括:
使用圖注意力神經模型將待對齊的至少兩個知識庫進行實體編碼,獲得注意力增強的實體向量表示,且所述注意力增強的實體向量表示融合了實體鄰居信息;
基于注意力增強的實體向量表示,使用知識庫表示學習模型,獲得用于約束所述實體向量表示的第一約束條件;
基于預先確定的等價實體對集合,獲得第二約束條件;
基于所述第一約束條件和所述第二約束條件,實現所述至少兩個知識庫之間的實體對齊。
2.根據權利要求1所述的知識庫實體對齊方法,其特征在于,所述使用圖注意力神經模型將待對齊的至少兩個知識庫進行實體編碼,獲得注意力增強的實體向量表示,且所述注意力增強的實體向量表示融合了實體鄰居信息,包括:
對于任一知識庫,獲取所述任一知識庫的實體及所有實體的鄰居集合;
將包括一個實體的向量表示矩陣和所述鄰居集合輸入至所述圖注意力神經模型,得到所述圖注意力神經模型輸出的所述實體向量表示;其中為有理數,n為所述任一知識庫的實體數量,s為向量表示的維度。
3.根據權利要求2所述的知識庫實體對齊方法,其特征在于,所述圖注意力神經模型包括L層卷積層,每一層應用公式
H(l+1)=σ(A(l)H(l)W(l))
確定,
其中,為第l層的隱狀態,為第l層的參數,H(0)=X,σ(·)為非線性激活函數ReLU(·)=max(0,·),為所述任一知識庫在自注意力機制作用下的連接性矩陣,A(l)的每一個元素表示所述任一知識庫中實體ei到ej的權重,A(l)應用公式
確定,
其中,為包含實體ei及所述實體ei的鄰居實體的集合,k為實體e的編號,ek為所述集合中的任一實體,為實體ei到ej的注意力參數,應用公式
確定,
其中,分別為實體ei和ej的隱狀態,
λ為預設常數,為學習的參數,·T為矩陣的轉置變換,為向量的拼接操作。
4.根據權利要求1-3中任一項所述的知識庫實體對齊方法,其特征在于,所述基于注意力增強的實體向量表示,使用知識庫表示學習模型,獲得用于約束所述實體向量表示的第一約束條件,包括:
基于所述實體向量表示,獲取待約束的實體;
根據所述待約束的實體和隨機初始化且學習得到的關系,獲取所述知識庫的事實三元組正例;
基于所述事實三元組正例,獲取對應的事實三元組負例;
根據所述事實三元組正例和所述事實三元組負例,獲得所述第一約束條件。
5.根據權利要求4所述的知識庫實體對齊方法,其特征在于,所述第一約束條件包括目標函數:
其中,[·]+=max(0,·),f(eh,r,et)=||eh+r-et||2,||·||2為二范數,實體eh和et的向量表示根據所述實體向量表示得到,關系r的向量表示根據隨機初始化且學習得到的關系向量表示R,為隨機初始化且學習得到的關系向量表示,γ1為預設的表征事實三元組正例(eh,r,et)和事實三元組負例(e'h,r',e′t)的間隔的超參數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于清華大學,未經清華大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010104948.7/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:事件百科文檔自動生成方法和裝置
- 下一篇:鉸鏈結構和折疊式電子設備





