[發明專利]一種基于多規則的知識圖譜動態生成方法在審
| 申請號: | 201811636257.0 | 申請日: | 2018-12-29 |
| 公開(公告)號: | CN109710775A | 公開(公告)日: | 2019-05-03 |
| 發明(設計)人: | 徐汕;梁炬;黃文鋒;張晶亮;單酉;楊端;衛未 | 申請(專利權)人: | 北京航天云路有限公司 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36 |
| 代理公司: | 北京紐樂康知識產權代理事務所(普通合伙) 11210 | 代理人: | 白明珠 |
| 地址: | 100039 北京市海淀區西*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 圖譜 處理規則 動態生成 原始數據 多源異構數據 存儲過程 方法生成 格式解析 規則生成 數據內容 統一處理 文件加載 一次處理 動態的 三元組 數據源 加載 解析 存儲 轉化 | ||
本發明公開一種基于多規則的知識圖譜動態生成方法,包括以下步驟:加載原始數據;將原始數據的格式解析并轉化生成為datarow格式;獲取相應的本體文件;將每個本體文件的數據內容按照相應的處理規則通過RDF三元組生成方法生成RDF文件;將生成的RDF文件進行解析存儲,在存儲過程中,形成知識圖譜。在知識圖譜生成的過程中可根據不同的數據源或本體文件加載相應一個或者是多個處理規則,在一次處理流程中可以動態的根據多種規則生成知識圖譜。提高多源異構數據統一處理的能力。
技術領域
本發明涉及知識圖譜生成方法技術領域,具體來說,涉及一種基于多規則的知識圖譜動態生成方法。
背景技術
知識圖譜隨著近幾年的發展有了廣泛的應用,例如在金融領域利用知識圖譜進行風險控制,在搜索領域利用知識圖譜進行對搜索結果進行推薦等,在知識圖譜構建領域主要是基于本體構建數據中實體以及實體之間的關系,進而來構建知識圖譜網絡。主要包括本體的構建和實體三元組的關系建立等。其中:
本體的構建主要是基于OWL語言來進行構建,OWL是一種通用的處理Web信息的內容的方法,由計算機應用程序來讀取。主要是通過定義類以及類的屬性來形式化某個領域;并通過定義個體并說明它們之間的屬性;OWL語言支持對類和個體進行推理。
實體三元組主要是構建基于RDF的三元組數據,RDF是(Resource DescriptionFramework)資源描述框架是一種用于描述Web資源的標記語言,一種描述信息的通用方法,這樣就可以被計算機應用程序讀取并理解,用來在網絡上顯示的主要用來描述知識圖譜中實體以及實體之間關系的一種標記型語言。
上述方法是知識圖譜構建過程中的基礎方法,目前針對知識圖譜的構建主要還是在封閉的空間內設計單獨的規則通過本體來構建實體以及關系。無法對異構數據進行統一的知識抽取。無法高效的利用多種規則動態的生成知識圖譜。
針對相關技術中的問題,目前尚未提出有效的解決方案。
發明內容
針對相關技術中的上述技術問題,本發明提出一種基于多規則的知識圖譜動態生成方法,可針對多源的結構化數據通過統一的流程,利用多種知識圖譜生成的規則動態的對數據進行知識抽取和知識圖譜的構建。可以提高知識圖譜的構建效率和提高數據的利用率。
為實現上述技術目的,本發明的技術方案是這樣實現的:
一種基于多規則的知識圖譜動態生成方法,包括以下步驟:
S1加載原始數據,所述原始數據包括數據源ID以及若干本體文件;
S2將所述原始數據的格式解析并轉化生成為datarow格式,轉化后的所述原始數據中,其本體文件的數據內容通過鍵值對的形式與本體ID相對應,所述數據內容包括若干實體以及每個所述實體所對應的屬性;
S3根據所述數據源ID及規則映射表獲取若干所述本體ID,再根據所述本體ID獲取相應的所述本體文件;
S4將每個所述本體文件的數據內容按照相應的處理規則通過RDF三元組生成方法生成RDF文件,從而得到每個所述本體文件中若干所述實體之間的關系;
S5將生成的所述RDF文件進行解析存儲,在存儲過程中,按照所述關系對不同所述本體文件中的所述實體進行關聯,從而形成知識圖譜。
進一步地,所述RDF三元組生成方法包括以下步驟:
S01利用jena工具解析所述本體文件,獲取所述本體文件中的所述實體和所述屬性并根據所述屬性得到若干所述實體之間的關系;
S02利用jena工具將得到的所述實體、所述屬性和所述關系抽取成具有繼承關系的Class;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京航天云路有限公司,未經北京航天云路有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811636257.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:結合平衡策略的圖數據劃分與分布式存儲方法
- 下一篇:相冊的知識圖譜的構建方法





