[發(fā)明專利]一種基于XML間接映射的RDF構(gòu)建方法在審
| 申請?zhí)枺?/td> | 202110059226.9 | 申請日: | 2021-01-15 |
| 公開(公告)號: | CN112860947A | 公開(公告)日: | 2021-05-28 |
| 發(fā)明(設(shè)計)人: | 劉玉春;馬宗民 | 申請(專利權(quán))人: | 南京航空航天大學 |
| 主分類號: | G06F16/84 | 分類號: | G06F16/84 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 210016 江*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 xml 間接 映射 rdf 構(gòu)建 方法 | ||
本發(fā)明公開了一種基于XML間接映射的RDF構(gòu)建方法,該方法通過映射文檔對XML文檔中的相關(guān)元素進行查詢定位來構(gòu)建RDF,關(guān)鍵在于設(shè)計一種適合于編寫該映射文檔的映射語言——X2RML,包括:闡述映射文檔的結(jié)構(gòu),X2RML映射文檔也被稱作映射圖,映射圖可以擁有若干個子映射圖;明確子映射圖所對應的三元組映射的結(jié)構(gòu),三元組映射包含邏輯樹組件、主語映射組件以及謂語?賓語映射組件,各個映射組件實現(xiàn)不同的映射功能;定義邏輯樹組件中的邏輯樹;定義主語映射組件;定義謂語?賓語映射組件,包括謂語映射組件和賓語映射組件。本發(fā)明的優(yōu)點是:用戶可以通過編輯映射文檔來自主選擇XML中的部分元素,然后將這部分元素映射為RDF。
技術(shù)領(lǐng)域
本發(fā)明公開了一種一種基于XML間接映射的RDF構(gòu)建方法。該方法通過映射文檔對XML文檔中的相關(guān)元素進行查詢定位來構(gòu)建RDF,關(guān)鍵在于設(shè)計一種適合于編寫該映射文檔的映射語言——X2RML。
背景技術(shù)
XML作為一種靈活的半結(jié)構(gòu)化標簽語言,在信息表示和數(shù)據(jù)交換方面有先天的優(yōu)勢。XML現(xiàn)在被廣泛的應用于各種團體和商界,在很多應用領(lǐng)域,人們已經(jīng)定義了基于XML的應用,比如數(shù)學領(lǐng)域(MathML)、天文領(lǐng)域(AML)、生物信息領(lǐng)域(BSML)、投資領(lǐng)域(IRML)等等。此外,可以作為統(tǒng)一數(shù)據(jù)交換格式的XML在企業(yè)信息交換方面也發(fā)揮了巨大的作用。XML已經(jīng)成為Web數(shù)據(jù)表示與交換的事實上的標準。
語義Web是基于圖和“鏈接”的組織方式,但是所鏈接的不再是網(wǎng)頁而是客觀世界中的實體,實體之間的鏈接也被增加了語義描述。RDF是語義Web中用于組織語義化數(shù)據(jù)的數(shù)據(jù)模型,RDF Schema通過定義RDF使用的詞匯為其賦予語義。知識圖譜作為語義Web發(fā)展的產(chǎn)物成為了研究的熱點,雖然并不是所有知識圖譜的描述框架是RDF,但本質(zhì)都是描述實體、實體的屬性及關(guān)系,知識圖譜中將三元組稱作為知識。RDF通過聚合大量的知識實現(xiàn)快速響應和推理,已經(jīng)被廣泛地應用到智能領(lǐng)域作為數(shù)據(jù)組織的方式。Web中存在大量不同結(jié)構(gòu)形態(tài)且沒有語義信息的數(shù)據(jù),基于這些數(shù)據(jù)構(gòu)建RDF或知識圖譜已經(jīng)成為了一個重要的研究方向。XML是Web中統(tǒng)一的數(shù)據(jù)存儲和交換格式,因其結(jié)構(gòu)靈活、可移植性強,以XML描述的數(shù)據(jù)廣泛存在于Web中,已經(jīng)有一些工作致力于研究基于XML構(gòu)建RDF的方法,但構(gòu)建效果不甚理想,綜合分析現(xiàn)有方法發(fā)現(xiàn)有以下幾點不足:映射規(guī)則不合理,不能真正反映數(shù)據(jù)蘊含的語義信息;可處理的XML類型單一,方法的通用性和可移植性較差;未能有效識別等價元素,無法避免所構(gòu)建的RDF出現(xiàn)冗余。本發(fā)明基于已有方法的不足提出基于XML間接映射的RDF構(gòu)建方法。
發(fā)明內(nèi)容
發(fā)明目的:本發(fā)明致力于使用戶可以通過編輯映射文檔來自主選擇XML中的部分元素,然后將這部分元素映射為RDF,另外該方法針對那些經(jīng)常發(fā)生更新的XML數(shù)據(jù)具有良好的映射效果。
技術(shù)方案:本發(fā)明方案主要包括以下步驟:
步驟一:構(gòu)建X2RML映射文檔。
X2RML映射文檔結(jié)構(gòu):X2RML映射文檔是以RDF圖的形式來描述的,即RDF不僅僅是映射XML數(shù)據(jù)的目標數(shù)據(jù)模型也是用于描述X2RML映射文檔所選用的數(shù)據(jù)模型,X2RML映射文檔也被稱作映射圖,映射圖可以擁有若干個子映射圖,每個子映射圖都對應一個三元組映射,三元組映射又包含邏輯樹組件、主語映射組件以及謂語-賓語映射組件,各個映射組件實現(xiàn)不同的映射功能;
步驟二:定義三元組映射。
(1)邏輯樹組件:邏輯樹組件中的邏輯樹確定了子映射圖所要映射的源數(shù)據(jù),然后使用三元組映射中的主語映射組件和謂語-賓語映射組件將邏輯樹確定的若干元素映射為若干條RDF三元組序列,每個元素對應一組與之相關(guān)的RDF三元組序列;
(2)主語映射組件:該組件中的主語映射將邏輯樹中定位的每個元素映射為所生成的與該元素相關(guān)的RDF三元組序列中的主語部分;
(3)謂語-賓語映射組件:包括謂語映射組件和賓語映射組件,映射結(jié)果即相關(guān)RDF三元組的屬性和值。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于南京航空航天大學,未經(jīng)南京航空航天大學許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110059226.9/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





