[發(fā)明專利]一種面向RDF三元組的專業(yè)數(shù)據(jù)直接映射方法在審
| 申請?zhí)枺?/td> | 201910488661.6 | 申請日: | 2019-06-06 |
| 公開(公告)號: | CN110377600A | 公開(公告)日: | 2019-10-25 |
| 發(fā)明(設(shè)計)人: | 肖清林 | 申請(專利權(quán))人: | 福建奇點時空數(shù)字科技有限公司 |
| 主分類號: | G06F16/22 | 分類號: | G06F16/22;G06F16/242;G06Q50/26 |
| 代理公司: | 北京勁創(chuàng)知識產(chǎn)權(quán)代理事務所(普通合伙) 11589 | 代理人: | 王志敏 |
| 地址: | 361000 福建省廈門市軟件園*** | 國省代碼: | 福建;35 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 數(shù)據(jù)映射 三元組 可達性 索引 映射邏輯 直接映射 專業(yè)數(shù)據(jù) 查詢 預處理 數(shù)據(jù)加工步驟 擴展性 長字符串 分割處理 獲取數(shù)據(jù) 解析數(shù)據(jù) 邏輯生成 配置數(shù)據(jù) 片段拼接 生成數(shù)據(jù) 數(shù)據(jù)文件 映射代碼 自動地 腳本 構(gòu)建 映射 整型 嵌入 解析 保存 | ||
一種面向RDF三元組的專業(yè)數(shù)據(jù)直接映射方法,包括以下步驟:預處理長字符串類型的RDF三元組;對長整型RDF三元組進行分割處理;構(gòu)建RDF數(shù)據(jù)的可達性查詢索引;保存RDF數(shù)據(jù)的可達性查詢索引;獲取待映射的數(shù)據(jù)文件;配置數(shù)據(jù)映射邏輯;獲取數(shù)據(jù)映射邏輯并對其進行解析,生成數(shù)據(jù)映射代碼;執(zhí)行數(shù)據(jù)映射代碼;解析數(shù)據(jù)中的邏輯段,獲得SQL片段;根據(jù)SQL片段拼接生成與數(shù)據(jù)加工步驟相對應的SQL語句;生成嵌入有上述SQL語句的數(shù)據(jù)映射腳本。本發(fā)明可以高效、準確地建立大規(guī)模RDF數(shù)據(jù)的可達性查詢索引,擴展性好,易于實現(xiàn),并且能夠自動地基于數(shù)據(jù)映射邏輯生成相應的代碼,顯著提高了數(shù)據(jù)映射的執(zhí)行效率,確保了生成的代碼與數(shù)據(jù)映射邏輯的一致性。
技術(shù)領(lǐng)域
本發(fā)明涉及專業(yè)數(shù)據(jù)直接映射技術(shù)領(lǐng)域,尤其涉及一種面向RDF三元組的專業(yè)數(shù)據(jù)直接映射方法。
背景技術(shù)
資料描述框架,簡稱RDF,是用于描述Web資源的標記語言,同時也是整個語義網(wǎng)系統(tǒng)結(jié)構(gòu)中的核心,它被廣泛用于描述互聯(lián)網(wǎng)上存在的各種信息資源,數(shù)據(jù)映射是指將源數(shù)據(jù)通過某種數(shù)據(jù)加工步驟映射為目標數(shù)據(jù)的過程,通常而言,源數(shù)據(jù)以及目標數(shù)據(jù)都是數(shù)據(jù)表的字段,而數(shù)據(jù)加工步驟則使用結(jié)構(gòu)化查詢語言語句來表示,用于描述數(shù)據(jù)映射的數(shù)據(jù)稱為數(shù)據(jù)映射邏輯,基于數(shù)據(jù)映射邏輯可以生成用于實現(xiàn)數(shù)據(jù)映射的代碼;
在現(xiàn)有技術(shù)中,數(shù)據(jù)映射邏輯通常采用文字描述的方式,將數(shù)據(jù)映射邏輯轉(zhuǎn)化為對應的代碼過程往往需要開發(fā)人員通過手工編寫,或在部分自動生成的基礎(chǔ)上結(jié)合大量的手工修改才能完成,不僅效率低,還容易導致代碼與數(shù)據(jù)映射邏輯不一致的情況發(fā)生,并且現(xiàn)有RDF三元組的專業(yè)數(shù)據(jù)的可達性查詢方式無法滿足快速有效處理數(shù)據(jù)的需求。
發(fā)明內(nèi)容
(一)發(fā)明目的
為解決背景技術(shù)中存在的技術(shù)問題,本發(fā)明提出一種面向RDF三元組的專業(yè)數(shù)據(jù)直接映射方法,可以高效、準確地建立大規(guī)模RDF數(shù)據(jù)的可達性查詢索引,擴展性好,易于實現(xiàn),并且能夠自動地基于數(shù)據(jù)映射邏輯生成相應的代碼,顯著提高了數(shù)據(jù)映射的執(zhí)行效率,確保了生成的代碼與數(shù)據(jù)映射邏輯的一致性。
(二)技術(shù)方案
為解決上述問題,本發(fā)明提出了一種面向RDF三元組的專業(yè)數(shù)據(jù)直接映射方法,包括以下步驟:
S1、預處理長字符串類型的RDF三元組,獲得與各長字符串類型的RDF三元組相對應的長整型RDF三元組;
S2、利用預設(shè)框架對長整型RDF三元組進行分割處理,生成數(shù)據(jù)索引文件夾;
S3、利用數(shù)據(jù)索引文件夾構(gòu)建RDF數(shù)據(jù)的可達性查詢索引;
S4、對構(gòu)建的RDF數(shù)據(jù)的可達性查詢索引進行驗證和評估;
S5、保存構(gòu)建的RDF數(shù)據(jù)的可達性查詢索引;
S6、獲取待映射的數(shù)據(jù)文件;
S7、配置數(shù)據(jù)映射邏輯;
S8、獲取數(shù)據(jù)映射邏輯并對其進行解析,生成數(shù)據(jù)映射代碼;
S9、執(zhí)行數(shù)據(jù)映射代碼,進行數(shù)據(jù)映射;
S10、解析數(shù)據(jù)中的邏輯段,獲得SQL片段;
S11、根據(jù)SQL片段拼接生成與數(shù)據(jù)加工步驟相對應的SQL語句;
S12、生成嵌入有上述SQL語句的數(shù)據(jù)映射腳本。
優(yōu)選的,在S1中,每個長整型RDF三元組包括主體、謂詞和客體。
優(yōu)選的,在S2中,預設(shè)框架為MapReduce框架或Spark框架。
優(yōu)選的,在S2中,還包括對長整型RDF三元組進行分類操作,并生成與每種分類方式相對應的數(shù)據(jù)索引文件夾。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于福建奇點時空數(shù)字科技有限公司,未經(jīng)福建奇點時空數(shù)字科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910488661.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





