[發明專利]一種迭代的實體對齊模型有效
| 申請號: | 201710565742.2 | 申請日: | 2017-07-12 |
| 公開(公告)號: | CN107480191B | 公開(公告)日: | 2020-08-21 |
| 發明(設計)人: | 劉知遠;朱昊;謝若冰;孫茂松 | 申請(專利權)人: | 清華大學 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36 |
| 代理公司: | 北京路浩知識產權代理有限公司 11002 | 代理人: | 王慶龍;曹杰 |
| 地址: | 100084 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 實體 對齊 模型 | ||
1.實體對齊方法,其特征在于,所述實體對齊方法應用于不同的單一領域或開放領域的知識庫中,所述方法包括步驟:
分別獲得第一知識圖譜KG1中實體的向量表示和第二知識圖譜KG2中實體的向量表示;所述知識庫包含有客觀世界上的一些有可區別性且獨立存在的事物;所述事物至少包括人名和地名;所述第一知識圖譜KG1中實體的向量為表示人名和地名的向量、所述第二知識圖譜KG1中實體的向量也為表示人名和地名的向量;KGi=(Ei,Ri,Ti)其中Ei,Ri,Ti分別表示知識圖譜中實體、關系、三元組的集合;
根據輸入的對齊種子實體對集合,綁定第一知識圖譜KG1和第二知識圖譜KG2中表示相同含義的實體向量表示,獲得第三知識圖譜KG;
根據第三知識圖譜KG、第一知識圖譜KG1中實體的向量表示和第二知識圖譜中實體的向量表示,迭代計算實體向量表示之間的相似度;在迭代計算過程中,若某一對實體向量表示的距離小于閾值,則將該對實體向量表示對應的實體對加入第三知識圖譜KG,直至第三知識圖譜KG的實體個數不再增加;
所述迭代計算實體向量表示之間的相似度,包括:
訓練第一知識圖譜KG1與第二知識圖譜KG2之間的映射關系,直到評價函數L最小;其中:
L=K+I;
KT=∑(h,r,t)∈TL(h,r,t);
L(h,r,t)=∑(h′,r′,t′)∈T-[γ+E(h,r,t)-E(h′,r′,t′)]+;
E(h,r,t)=||h+r-t||;
其中[x]+=max{0,x}表示0和x中的最大值,
T-=
{(h′,r,t)|h′∈E1∪E2}∪{(h,r,t′)|t′∈T1∪T2}∪{(h,r′,t)|r′∈R},(h,r,t)∈KG1∪KG2};
R(e1,e2)=σ(k(θ-E(e1,e2)));
E(p,r)=|(|p-r|)|=|(|p-(t-h)|)|=E(h,p,t);
其中,H(ex,ey)函數表示將K函數中的每一項ex替換為ey之后的函數,第一知識圖譜KG1=(E1,R,T1),第二知識圖譜KG2=(E2,R,T2),第三知識圖譜KG=(E,R,T);其中,E、E1、E2表示分別屬于和KG、KG1和KG2實體集、R表示KG、KG1和KG2中的關系集;T、T1和T2表示分別屬于KG、KG1和KG2的三元組的集合;e1∈E1,e2∈E2,e、h∈E1∪E2,r1、r2∈R,t∈T1∪T2,γ、θ、Z為超參數。
2.根據權利要求1所述的方法,其特征在于,所述迭代計算實體向量表示之間的相似度,包括:
通過隨機梯度下降,最小化評價函數,對所有參數進行學習與更新。
3.一種計算機可讀存儲介質,其上存儲有計算機程序,其特征在于,該程序被處理器執行時實現如權利要求1或2所述方法的步驟。
4.一種計算機設備,包括存儲器、處理器以及存儲在所述存儲器上并可在所述處理器上執行的計算機程序,其特征在于,所述處理器執行所述程序時實現如權利要求1或2所述方法的步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于清華大學,未經清華大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710565742.2/1.html,轉載請聲明來源鉆瓜專利網。





