[發明專利]面向知識圖譜多跳推理的錐嵌入方法在審
| 申請號: | 202110692090.5 | 申請日: | 2021-06-22 |
| 公開(公告)號: | CN113449075A | 公開(公告)日: | 2021-09-28 |
| 發明(設計)人: | 王杰;張占秋;陳佳俊 | 申請(專利權)人: | 中國科學技術大學 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/36;G06N3/04;G06N3/08;G06N5/04 |
| 代理公司: | 北京凱特來知識產權代理有限公司 11260 | 代理人: | 鄭立明;付久春 |
| 地址: | 230026 安*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 面向 知識 圖譜 推理 嵌入 方法 | ||
1.一種面向知識圖譜多跳推理的錐嵌入方法,其特征在于,包括:
步驟1,通過訓練集利用梯度下降算法對查詢錐嵌入模型進行訓練,所述訓練集為給定的一個包含若干實體的知識圖譜數據集的子集;所述查詢錐嵌入模型能將實體和查詢表示為2維錐的笛卡爾積,并在嵌入空間中設置與、或、非算子,建模所有一階邏輯查詢;
步驟2,利用訓練好的查詢錐嵌入模型對一個給定查詢,先將其生成錐嵌入,然后計算該錐嵌入與各個實體嵌入之間的距離,以距離最近的實體作為該查詢的答案。
2.根據權利要求1所述的面向知識圖譜多跳推理的錐嵌入方法,其特征在于,所述步驟2中,按以下公式將一個給定查詢[[q]]生成為錐嵌入,公式為:
其中,[[q]]是僅包含與操作的查詢q的答案實體;是軸嵌入;是幅角嵌入;d嵌入維數;
實體v的錐嵌入為v=(θax,0)。
3.根據權利要求2所述的面向知識圖譜多跳推理的錐嵌入方法,其特征在于,對生成的所述錐嵌入的投影操作定義為:
fr(Vq)=g(MLP([θax+θax,r/2;θap+θap,r/2]))};
其中,MLP是一個保持輸入維數的多層感知機網絡;[·,·]是兩個向量的拼接;r=(θax,r,θap,r)是d維的錐空間中為每一個關系分配一個嵌入;g是一個向量值函數其中,[g(x)]i表示g(x)的第i個元素,λ1和λ2是兩個固定參數。
4.根據權利要求2所述的面向知識圖譜多跳推理的錐嵌入方法,其特征在于,對生成的所述錐嵌入的與操作定義為:
其中,和分別是[[q]]和[[qi]]的錐嵌入,其中SemanticAverage是用來生成θax的函數,CardMin是用來生成θap的函數;
SemanticAverage的定義為:
θax=Arg(X,y);
其中,cos和sin分別是按向量的每個元素進行計算的余弦函數和正弦函數;ai是滿足加和為1的正數;Arg是一個計算二維點角度的函數;ai通過以下方式計算:
其中,MLP是一個保持輸入維數的多層感知機網絡,[·,·]是兩個向量的拼接,Arg通過以下方式計算:
βi=arctan([y]i/[x]i)
CardMin函數的定義為:
其中,σ是按元素的sigmoid函數,是θj,ap的第i個元素,DeepSets是如下定義的函數:
5.根據權利要求2所述的面向知識圖譜多跳推理的錐嵌入方法,其特征在于,對生成的所述錐嵌入的或操作定義為:
若將并集[[q]]的嵌入表示為[[qi]]嵌入的集合
6.根據權利要求2所述的面向知識圖譜多跳推理的錐嵌入方法,其特征在于,對生成的所述錐嵌入的非操作定義為:
給定實體集合[[q]],非操作的生成定義的嵌入為:
[θ′ap]i=2π-[θap]i。
7.根據權利要求2所述的面向知識圖譜多跳推理的錐嵌入方法,其特征在于,所述訓練好的查詢錐嵌入模型按以下方式計算該錐嵌入與給定實體嵌入之間的距離:
其中,dcon的定義為:do和di分別是外部距離和內部距離;是查詢q的錐嵌入;λ是一個取值小于1的固定參數,取值為,所述do和di定義分別為:
ddis的定義為:
所述查詢錐嵌入模型訓練的損失函數為:
其中,γ>0是固定參數,v是正樣本實體,v′i是負樣本實體。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學技術大學,未經中國科學技術大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110692090.5/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:放射科擋鉛架
- 下一篇:一種內冷鉆頭制備方法、內冷鉆頭和加熱裝置





