[發明專利]一種多源時空知識融合方法有效
| 申請號: | 202110320156.8 | 申請日: | 2021-03-25 |
| 公開(公告)號: | CN112905807B | 公開(公告)日: | 2022-07-08 |
| 發明(設計)人: | 胡錚;朱新寧;張曉晗;張春紅;唐曉晟 | 申請(專利權)人: | 北京郵電大學 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F16/387;G06F40/194;G06N20/00 |
| 代理公司: | 北京永創新實專利事務所 11121 | 代理人: | 易卜 |
| 地址: | 100876 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 時空 知識 融合 方法 | ||
本發明公開了一種多源時空知識融合方法,屬于知識圖譜領域。具體為:首先,選取兩種時空精度和采樣率都有較大差異的異質時空數據源,分別進行預處理,得到各自對應的時空軌跡序列;并分別構建各自對應的時空知識圖譜;接著、利用基于衰減機制的長路徑的知識圖表示算法對時空知識圖譜中的三元組分別進行訓練學習,得到每個實體對應的最終低維向量;依次選擇第二種時空知識圖譜中的未對齊實體S,經過變換函數后與第一種時空知識圖譜中的所有實體逐一進行相似度對比,選擇相似度最高的實體進行實體對的匹配;最后,按照所有實體對齊的結果,對兩種不同的時空數據源進行時空知識的融合;本發明有效的彌補了單一時空數據源中時空知識的不完整性。
技術領域
本發明涉及知識圖譜領域,具體是一種多源時空知識融合方法。
背景技術
知識融合的目的是將不同來源的知識進行整合,從而使知識驅動的應用程序受益;多源數據融合可以修正單源知識的不確定性,借助知識圖譜進行知識融合是一個很好的解決辦法。知識圖譜已經成為以知識為驅動的各類應用的重要資源,如搜索引擎、問答以及推薦系統。知識圖譜結構化地存儲了大量現實世界中的事實;其中,每個事實都以三元組(h,r,t)來描述,其中h,r,t分別表示頭實體、尾實體以及它們之間的關系。
但由于不同知識圖譜中知識來源的多樣性和知識結構的異構性,已有的知識圖譜往往存在著以下問題:(1)不同知識圖譜間存在很多知識重復或補充;(2)單一知識圖譜的質量低、信息覆蓋度低、知識描述不完全;在融合不同知識圖譜中的知識時,實體表示和實體對齊技術是首要的關鍵技術。
目前已有的知識圖嵌入模型可以分為兩類:基于翻譯的模型和基于路徑推理的模型;
基于翻譯的模型將關系作為從頭實體向量到尾實體向量的平移向量,期望知識圖中每一個三元組(h,r,t)滿足h+r≈t。為了解決多跳推理問題,在嵌入模型的基礎上引入了路徑推理算法,它將實體間的多步關系路徑表示為低維向量空間中的向量,從而將兩種方法相結合,在嵌入模型的基礎上考慮了關系路徑的隱含信息,極大地提高了知識推理的效果。
實體對齊,致力于將兩個不同知識圖譜中指稱相同的實體鏈接起來。如文獻1:《Ajoint embedding method for entity alignment of knowledge bases》將不同的知識圖聯合嵌入到一個統一的向量空間中,以對齊知識圖中的實體。文獻2:《Multilingualknowledge graph embeddings for cross-lingual knowledge alignment》學習轉換,將每個實體的嵌入向量轉換為另一個空間中的對應向量,還有一些工作通過實體的屬性來幫助實體進行對齊工作。
對于實體表示技術,文獻3:CN 106909622 A提出了一種基于路徑的知識圖譜嵌入方法,包括以下步驟:將知識圖譜中的實體對、關系和實體對之間的多步關系路徑表示為初始低維向量;利用損失函數訓練實體對、關系和實體對之間的多步關系路徑的低維向量表示的模型。
文獻4:CN 110188206 A公開了一種基于翻譯模型的協同迭代聯合實體對齊方法及裝置,該方法包括:在嵌入實體后,通過協同迭代訓練模塊選取語義距離最小的一對實體組成實體對,將滿足預設距離閾值的實體對添加到實體對齊種子集,對實體對齊種子集進行更新;迭代直至不存在滿足預設距離閾值的實體對。
目前的技術方案存在以下問題:
1)、目前的知識圖譜融合都是針對跨語言標準的三元組數據,基于軌跡構建的時空順序知識圖譜幾乎沒有。所以現有基于文本相似度,屬性相似度的實體對齊技術并不適用于時空知識圖譜。
2)、目前基于路徑的實體表示大多采用隨機游走的方式來生成,導致路徑信息不準確。同時簡單地組合關系向量來構造多跳路徑向量,不利于嵌入更長的關系路徑;并且關系路徑中所有位置具有同等地位是不合適的,距離尾實體越近的關系應該具有更高的影響因子。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京郵電大學,未經北京郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110320156.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種高精度傳感器
- 下一篇:三次諧波數控五軸轉臺





