[發明專利]多數域空間融合的知識圖譜嵌入方法、系統、設備及介質在審
| 申請號: | 202211535760.3 | 申請日: | 2022-12-02 |
| 公開(公告)號: | CN115795050A | 公開(公告)日: | 2023-03-14 |
| 發明(設計)人: | 請求不公布姓名 | 申請(專利權)人: | 成都數之聯科技股份有限公司 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F18/214 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 610000 四川省*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 多數 空間 融合 知識 圖譜 嵌入 方法 系統 設備 介質 | ||
本發明提供了多數域空間融合的知識圖譜嵌入方法、系統、設備及介質,涉及知識圖譜嵌入領域,所述方法包括步驟:(1)構造訓練集;(2)對訓練集進行初始化處理;(3)對訓練集進行采樣處理,構造訓練子集;(4)將訓練子集導入知識圖譜嵌入模型,獲取不同數域空間下的三元組分數和注意力分數;(5)利用不同數域空間下的三元組分數和注意力分數對知識圖譜嵌入模型進行迭代訓練至收斂;(6)將知識圖譜的三元組輸入迭代訓練后的知識圖譜嵌入模型進行補全。本發明通過注意力機制結合在實數域、復數域、四元數域的計算,從不同空間捕獲實體的特征信息,深度刻畫實體和關系的空間表示,從而在知識圖譜補全任務中提升三元組匹配的精確度。
技術領域
本發明涉及知識圖譜嵌入領域,具體而言,涉及了多數域空間融合的知識圖譜嵌入方法、系統、設備及介質。
背景技術
知識圖譜嵌入是解決知識圖譜補全問題的重要方法之一,該技術通過學習知識圖譜中節點和邊的特征,將其表示為低維稠密向量。知識圖譜嵌入的研究主要集中在對三元組的實體和關系的建模,當前的研究工作通常用一種相似性理論刻畫實體和關系間的聯系。
目前,知識圖譜嵌入主要采用翻譯模型或旋轉模型建模三元組中頭實體和尾實體的關系。翻譯模型認為三元組中頭實體和尾實體之間存在平移(翻譯)關系,即頭實體h經過關系r平移后會接近尾實體t。旋轉模型則認為三元組中頭實體h和尾實體t之間存在旋轉關系,頭實體h經過關系r表示的旋轉矩陣旋轉后接近尾實體t。翻譯模型能夠對不對稱關系、組合關系進行建模,但不能對對稱關系、一對多、多對一等復雜關系進行建模。旋轉模型解決了這一問題,但依然不能解決對多重復雜關系的建模。
發明內容
本發明實施例提供了多數域空間融合的知識圖譜嵌入方法、系統、設備及介質,以旋轉模型為基點,結合不同數域空間下的旋轉變換,來建?,F有知識圖譜中的復雜關系。
在第一方面,本發明實施例中提供一種多數域空間融合的知識圖譜嵌入方法,所述方法包括以下步驟:
(1)基于知識圖譜的三元組和注意力參數構造訓練集,并且將訓練集導入知識圖譜嵌入模型;
(2)對不同數域空間下的三元組和注意力參數進行初始化處理;
(3)對訓練集進行采樣處理,構造訓練子集Δnew_batch;
(4)將訓練子集Δnew_batch導入知識圖譜嵌入模型,基于旋轉變換獲取不同數域空間下的注意力分數和三元組分數;
(5)利用不同數域空間下的注意力分數和三元組分數對知識圖譜嵌入模型進行迭代訓練至收斂;
(6)將知識圖譜的三元組輸入迭代訓練后的知識圖譜嵌入模型進行補全。
于上述實施例中,通過結合三元組和注意力機制在實數域、復數域、四元數域的計算,從不同空間捕獲實體(頭實體或者尾實體)的特征信息,深度刻畫實體和關系的空間表示,從而在知識圖譜補全任務中提升三元組匹配的精確度。
作為本申請一些可選實施方式,所述三元組包括頭實體h、關系r以及尾實體t。
作為本申請一些可選實施方式,對不同數域空間下的三元組和注意力參數進行初始化處理的步驟如下:
(2.1)將訓練集中三元組的頭實體h和尾實體t隨機初始化為一維向量,得到實體嵌入向量e,所述實體嵌入向量e包括頭實體嵌入向量eh和尾實體嵌入向量et;將訓練集中三元組的關系r隨機初始化為一維向量,得到關系嵌入向量er;并且將注意力參數初始化為一維向量,得到注意力參數向量αr;
(2.2)在實數空間中,將實體嵌入向量e和關系嵌入向量er作為知識圖譜嵌入模型的輸入;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于成都數之聯科技股份有限公司,未經成都數之聯科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211535760.3/2.html,轉載請聲明來源鉆瓜專利網。





