[發明專利]一種量綱知識圖譜構建方法有效
| 申請號: | 202011112293.4 | 申請日: | 2020-10-16 |
| 公開(公告)號: | CN112256883B | 公開(公告)日: | 2023-01-13 |
| 發明(設計)人: | 曹皓偉;王小紅;趙志剛 | 申請(專利權)人: | 山東省計算中心(國家超級計算濟南中心) |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F18/25 |
| 代理公司: | 北京華際知識產權代理有限公司 11676 | 代理人: | 褚慶森 |
| 地址: | 250014 山東省濟*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 量綱 知識 圖譜 構建 方法 | ||
本發明的量綱知識圖譜構建方法,包括:a).多源異構數據獲取;收集互聯網上、專家手工整理以及論文中開放共享的科研數據;b).量綱數據預處理;c).量綱數據融合;對來源不同的量綱數據進行人工對齊與建立關聯;d).量綱數據的圖存儲;將經步驟c)融合后的量綱數據導入Neo4J圖數據庫中,構建量綱知識圖譜;e).量綱知識圖譜自動化更新。本發明的量綱知識圖譜構建方法,可實現量綱知識圖譜可以自動化更新,有利于解決數據融合過程中基本單位之間的異構性問題,有利于提升相似性算法、實體對齊和知識融合算法的準確性,同時也有利于提升知識圖譜的可計算性。
技術領域
本發明涉及一種量綱知識圖譜構建方法,更具體的說,尤其涉及一種的量綱知識圖譜構建方法。
背景技術
知識圖譜用于描述現實世界中的實體、概念和關系,是一張巨大的描述現實世界的語義網絡。隨著知識圖譜技術的不斷發展和應用,知識圖譜與機器學習、深度學習緊密結合,在人工智能領域發揮著不可替代的作用;如何自動化構建準確性高、數據完整、語義合理的知識圖譜成為近年來的研究熱點;知識圖譜的構建過程一般分為數據獲取、知識抽取、知識融合、知識處理和知識存儲五個步驟,如圖1所示給出了其構建過程原理圖,在知識圖譜構建過程中可以維護一個先驗知識庫,如先驗知識圖譜、本體可控詞匯集等等,先驗知識庫一方面可以指導知識圖譜構建的各個過程,另一方面也可以根據領域數據特性更新完善先驗知識庫,本專利提出的量綱知識圖譜就屬于知識圖譜構建過程中的先驗知識庫。
圖數據庫存儲技術來源于圖論,是一種以圖的形式對客觀世界進行存儲的技術,目前廣泛使用的圖數據庫可以分為原生圖數據庫、非原生圖書庫、開源圖數據庫、商業圖數據庫等等;本專利采用原生圖數據庫Neo4J社區版對量綱知識進行存儲,Neo4J社區版是一個高性能開源圖引擎,支持ACID,使用類CQL語言CYPHER進行數據查詢;Neo4J底層基于圖數據結構(由數組和線性表組成)進行存儲,可以高效查詢復雜的數據關系,其存儲結構如圖2所示。
發明內容
本發明為了克服上述技術問題的缺點,提供了一種量綱知識圖譜構建方法。
本發明的量綱知識圖譜構建方法,其特征在于,通過以下步驟來實現:
a).多源異構數據獲取;收集互聯網上、專家手工整理以及論文中開放共享的科研數據,這些科研數據來源廣泛,不同數據源的科研數據具有異構性質;
b).量綱數據預處理;從多源異構的科研數據中識別并提取單位信息,完成量綱數據的抽取工作,量綱數據中的單位信息主要分為基本物質量信息、詞頭信息、導出單位信息、基本常數信息四部分;
c).量綱數據融合;對來源不同的量綱數據進行人工對齊與建立關聯,人工對齊是指將含義相同但表達方式不同的單位進行對齊,建立關聯是指構建出不同單位之間的關系;
d).量綱數據的圖存儲;將經步驟c)融合后的量綱數據導入Neo4J圖數據庫中,構建量綱知識圖譜;
e).量綱知識圖譜自動化更新,利用已建立的量綱知識圖譜自主識別與添加未知單位,在識別過程中,對未知單位進行拆分,拆分為已知的基本單位,使用基于圖的廣度優先檢索算法對已知的基本單位進行搜索與運算,得到量綱知識圖譜中所包含的單位,從而建立未知單位與已知單位的關聯,最終實現未知單位的自主識別與更新。
本發明的量綱知識圖譜構建方法,步驟b)所述的量綱數據預處理過程中,基本物質量信息包括長度l、質量m、時間t、電流i、熱力學溫度T、物質的量n和發光強度lv七個基本物理量,預處理數據中記錄了七個基本物理量的單位名稱、單位符號、物理量的表達符號以及物理量的名稱;詞頭信息用于表示單位之間的數量關系,導出單位信息表示由基本物理量或導出單位組合而成的單位信息。
本發明的量綱知識圖譜構建方法,步驟c)中所述的不同單位之間的關系包括等價關系、運算關系和倒數關系。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于山東省計算中心(國家超級計算濟南中心),未經山東省計算中心(國家超級計算濟南中心)許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011112293.4/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種手機屏幕初加工生產線
- 下一篇:一種蘭姆波諧振器及其制造方法





