[發(fā)明專利]一種基于多源異構(gòu)數(shù)據(jù)的層次本體構(gòu)造方法有效
| 申請?zhí)枺?/td> | 202110632417.X | 申請日: | 2021-06-07 |
| 公開(公告)號: | CN113360518B | 公開(公告)日: | 2023-03-21 |
| 發(fā)明(設(shè)計(jì))人: | 涂志瑩;張明陽;初佃輝;張凱 | 申請(專利權(quán))人: | 哈爾濱工業(yè)大學(xué) |
| 主分類號: | G06F16/24 | 分類號: | G06F16/24;G06F16/25;G06F16/28 |
| 代理公司: | 哈爾濱龍科專利代理有限公司 23206 | 代理人: | 李智慧 |
| 地址: | 150001 黑龍*** | 國省代碼: | 黑龍江;23 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 多源異構(gòu) 數(shù)據(jù) 層次 本體 構(gòu)造 方法 | ||
1.一種基于多源異構(gòu)數(shù)據(jù)的層次本體構(gòu)造方法,其特征在于所述方法包括如下步驟:
步驟S1、獲取關(guān)系型數(shù)據(jù)庫數(shù)據(jù);
步驟S2、提取數(shù)據(jù)庫中數(shù)據(jù)模式;
步驟S3、挖掘數(shù)據(jù)中隱藏關(guān)系信息;
步驟S4、根據(jù)數(shù)據(jù)模式信息生成映射文件;
步驟S5、根據(jù)映射文件以及數(shù)據(jù)庫數(shù)據(jù),篩選有效個體,生成本體,具體步驟如下:
步驟(1)檢查映射文件,確保映射文件的格式正確,并且不存在命名重復(fù)的情況;
步驟(2)根據(jù)映射文件生成實(shí)體;
步驟(3)根據(jù)映射文件生成屬性,并連接到對應(yīng)實(shí)體上,屬性的uri為“實(shí)體的uri/屬性名”;
步驟(4)讀取映射文件中的外鍵關(guān)系,為實(shí)體之間添加關(guān)系,為關(guān)系添加comment屬性,將關(guān)系對應(yīng)的兩表的連接信息存儲到關(guān)系型數(shù)據(jù)庫中,將該條數(shù)據(jù)的id值賦給comment;
步驟(5)讀取映射文件中的預(yù)測關(guān)系,重復(fù)步驟(4)中添加關(guān)系的操作,然后判斷預(yù)測關(guān)系的標(biāo)志值,根據(jù)標(biāo)志值將實(shí)體分為待實(shí)例化和不需實(shí)例化兩類,待實(shí)例化集中將生成有效個體;
步驟(6)遍歷實(shí)例化集合,從數(shù)據(jù)庫中讀取該實(shí)體對應(yīng)表中的數(shù)據(jù),將這些數(shù)據(jù)進(jìn)行實(shí)例化,生成有效個體;
步驟(7)將數(shù)據(jù)保存為本體rdf / owl文件;
步驟S6、讀取生成的本體文件,將本體融合入默認(rèn)本體中。
2.根據(jù)權(quán)利要求1所述的基于多源異構(gòu)數(shù)據(jù)的層次本體構(gòu)造方法,其特征在于所述步驟S1的具體步驟如下:
(1)提供用戶名和密碼,遠(yuǎn)程連接需要的數(shù)據(jù)庫;
(2)使用.sql文件將數(shù)據(jù)導(dǎo)入到本地進(jìn)行使用。
3.根據(jù)權(quán)利要求1所述的基于多源異構(gòu)數(shù)據(jù)的層次本體構(gòu)造方法,其特征在于所述步驟S2的具體步驟如下:
(1)檢索數(shù)據(jù)庫中各表的信息,提取每一個表的表信息;
(2)檢索各表中各列的信息,提取每一列的列信息;
(3)判斷表是否擁有主鍵,如果擁有主鍵則存儲主鍵列信息;
(4)檢索各表,判斷表是否有外鍵,如果有外鍵,則在table類中存儲外鍵對應(yīng)的表和列信息。
4.根據(jù)權(quán)利要求1所述的基于多源異構(gòu)數(shù)據(jù)的層次本體構(gòu)造方法,其特征在于所述步驟S3的具體步驟如下:
(1)檢索各表,如果該表包含主鍵,則將主鍵中所有數(shù)據(jù)存到Redis中,數(shù)據(jù)的組織形式為set,一個表的主鍵對應(yīng)一個set;
(2)檢索各表,將該表中除了主鍵以外的所有列,分別與Redis中其它表的主鍵數(shù)據(jù)進(jìn)行匹配,判斷列之間的對應(yīng)關(guān)系,并設(shè)置標(biāo)志位;
(3)將(2)中挖掘到的關(guān)系存儲到table類中。
5.根據(jù)權(quán)利要求4所述的基于多源異構(gòu)數(shù)據(jù)的層次本體構(gòu)造方法,其特征在于所述(2)中,如果本表該列數(shù)據(jù)有重復(fù),將標(biāo)志設(shè)置為n,如果沒有則標(biāo)志設(shè)置為1;如果本表中數(shù)據(jù)有不存在于正在匹配的表的主鍵,則判斷該列與正在匹配的表無關(guān);如果本表中所有數(shù)據(jù)都存在于正在匹配的表的主鍵中,則判斷該列與正在匹配的表有關(guān),關(guān)系為標(biāo)志位所代表的關(guān)系。
6.根據(jù)權(quán)利要求1所述的基于多源異構(gòu)數(shù)據(jù)的層次本體構(gòu)造方法,其特征在于所述步驟S4的具體步驟如下:
根據(jù)步驟S2、步驟S3獲得的數(shù)據(jù)模式信息構(gòu)建將數(shù)據(jù)庫中信息映射到本體的映射文件,其中:映射文件中包含表名以及對應(yīng)的實(shí)體名、列名以及對應(yīng)的屬性名、外鍵關(guān)系對應(yīng)的表之間信息和關(guān)系名以及挖掘預(yù)測的關(guān)系和對應(yīng)的表之間信息和關(guān)系名。
7.根據(jù)權(quán)利要求1所述的基于多源異構(gòu)數(shù)據(jù)的層次本體構(gòu)造方法,其特征在于所述步驟(5)中,將標(biāo)志位為n的關(guān)系的來源實(shí)體名放入待實(shí)例化集合中,另一個實(shí)體名放入不需實(shí)例化集合中;判斷標(biāo)志位為1的關(guān)系,如果關(guān)系兩邊有一個存在于待實(shí)例化集合中,另一個不存在,則將不存在的實(shí)體名放入待實(shí)例化集合中;如果一個存在于不需實(shí)例化集合中,則將另一個也放入不需實(shí)例化集合中。
8.根據(jù)權(quán)利要求1所述的基于多源異構(gòu)數(shù)據(jù)的層次本體構(gòu)造方法,其特征在于所述步驟S6的具體步驟如下:
(1)將每一個概念層的實(shí)體與默認(rèn)本體中的每一個實(shí)體和屬性進(jìn)行語義相似度和結(jié)構(gòu)相似度匹配,生成匹配表;
(2)根據(jù)匹配表,將兩本體連接,若匹配表中的匹配項(xiàng)為1:null,則在默認(rèn)本體中創(chuàng)建相同的實(shí)體;若匹配表中的匹配項(xiàng)為1:1,則進(jìn)行約束補(bǔ)全,包括上下位關(guān)系補(bǔ)全、定義域、值域補(bǔ)全與屬性約束補(bǔ)全。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于哈爾濱工業(yè)大學(xué),未經(jīng)哈爾濱工業(yè)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110632417.X/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 多源異構(gòu)數(shù)據(jù)高效匯聚存取架構(gòu)系統(tǒng)
- 用于電網(wǎng)的多源異構(gòu)數(shù)據(jù)處理方法及裝置
- 一種配用電數(shù)據(jù)的處理方法及系統(tǒng)
- 一種面向水下探測的多源異構(gòu)數(shù)據(jù)預(yù)處理方法及系統(tǒng)
- 一種基于深度學(xué)習(xí)的綜采工作面多源異構(gòu)數(shù)據(jù)融合方法
- 基于業(yè)務(wù)規(guī)則的多源異構(gòu)數(shù)據(jù)表示與分發(fā)方法、裝置
- 一種基于邊緣計(jì)算的電力異構(gòu)數(shù)據(jù)處理方法
- 適用于多源異構(gòu)電網(wǎng)的運(yùn)行方式拓?fù)浣Y(jié)構(gòu)特征提取方法
- 一種多源異構(gòu)數(shù)據(jù)關(guān)聯(lián)方法
- 一種多源異構(gòu)數(shù)據(jù)的描述方法、解析方法及裝置
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





