[發明專利]一種用于知識圖譜的噪音檢測及知識完成的方法和設備在審
| 申請號: | 202110021632.6 | 申請日: | 2021-01-08 |
| 公開(公告)號: | CN112732931A | 公開(公告)日: | 2021-04-30 |
| 發明(設計)人: | 趙翔;譚真;邵天陽;李碩豪;郭得科;肖衛東;張軍 | 申請(專利權)人: | 中國人民解放軍國防科技大學 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F16/28 |
| 代理公司: | 長沙大珂知識產權代理事務所(普通合伙) 43236 | 代理人: | 伍志祥 |
| 地址: | 410073 湖*** | 國省代碼: | 湖南;43 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 用于 知識 圖譜 噪音 檢測 完成 方法 設備 | ||
1.一種用于知識圖譜的噪音檢測及知識完成的方法,其特征在于,包括以下步驟:
步驟1,獲取含有噪音的知識圖譜的數據;
步驟2,基于翻譯框架將實體和關系投影到低維空間;
步驟3,引入實體類型層次信息和關系路徑信息;
步驟4,計算三元組中實體和關系的匹配度;
步驟5,計算所述匹配度的可信度;
步驟6,綜合所述匹配度和所述可信度計算三元組評分;
所述的知識圖譜表示為,G=(E,R,T),其中E代表實體,R代表關系,代表圖譜中的三元組。
2.根據權利要求1所述的用于知識圖譜的噪音檢測及知識完成的方法,其特征在于,所述的步驟2中利用基于翻譯的框架,將所述實體E和所述關系R投影到一個連續且低維的空間中;
步驟3中引入實體類型層次信息和關系路徑信息,所述實體類型層次信息為:
Te=α1Tc1+α2Tc2+…+αnTcn
EHT(Th,r,Tt)=||Th+r-Tt||
其中Th和Tt為引入所述實體類型層次信息的實體的表示,Tci和αi分別為ci對應的表示和權重,n是實體e所具有的類型的數量,ci是實體e所屬的實體類型,m是多層結構中c類型的層數,Tc(i)是第i個子類型ci的投影矩陣,頭實體和尾實體h,t∈E和r∈R;
所述關系路徑信息為:
其中,R(h|p,t)是給定實體對(h,t)的關系路徑p的可靠度;Z=∑p∈P(h,t)R(p|h,t)是一個正態化因子,E(h,p,t)是實體對的能量函數;
步驟4中計算三元組中實體和關系的匹配度公式為:
PT(h,r,t)=EHT(h,r,t)+RP(h,P,t)
步驟5中計算三元組匹配度的可靠度中進一步利用所述實體類型層次信息和所述關系路徑信息:
E(h,r,t)=PT(h,r,t)
Q(h,r,t)=-(γ+E(h,r,t)-E(h′,r′,t′))
LS(h,r,t)=μ·LS(h,r,t),Q(h,r,t)<0
其中,μ是確保LS(h,r,t)>0的超參數;
QDPS(r,pi)=||r-pi||=||r-(ri1+…+rim)||
其中,σ(·)是激活函數;
計算三元組匹配度的可靠度公式為:
S(h,r,t)=λ1·LS(h,r,t)+λ2·DPS(h,r,t)
其中,λ1和λ2是用來調整LS(h,r,t)和DPS(h,r,t)的超參數。
3.根據權利要求2所述的用于知識圖譜的噪音檢測及知識完成的方法,其特征在于,所述的實體類型層次信息是將實體的類型信息投影到實體所在的平面,然后將兩者結合起來,所述的關系路徑信息是通過推理,建立實體間的多步關系,所述的實體類型層次信息和所述的關系路徑信息衡量了三元組中實體和關系的匹配度以及所述匹配度的可信度。
4.根據權利要求2或3所述的用于知識圖譜的噪音檢測及知識完成的方法,其特征在于,所述的基于翻譯的框架,輸入是實體和關系詞向量形式、實體類型層次信息的矩陣和關系路徑信息,輸出是每個三元組中實體和關系的匹配度和所述匹配度的可信度的乘積。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國人民解放軍國防科技大學,未經中國人民解放軍國防科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110021632.6/1.html,轉載請聲明來源鉆瓜專利網。





