[發明專利]一種數據庫元數據關系知識圖譜生成方法在審
| 申請號: | 202210508938.9 | 申請日: | 2022-05-10 |
| 公開(公告)號: | CN115203337A | 公開(公告)日: | 2022-10-18 |
| 發明(設計)人: | 林劼;李賽鵬;姜錸;王元芳;肖新宇;白毅 | 申請(專利權)人: | 電子科技大學 |
| 主分類號: | G06F16/28 | 分類號: | G06F16/28;G06F16/907;G06N5/02;G06N5/04 |
| 代理公司: | 成都金英專利代理事務所(普通合伙) 51218 | 代理人: | 郭肖凌 |
| 地址: | 610041 四川省成*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 數據庫 數據 關系 知識 圖譜 生成 方法 | ||
1.一種數據庫元數據關系知識圖譜生成方法,其特征在于,包括以下步驟:
步驟1:基于數據庫的歷史SQL查詢語句形成歷史查詢元數據知識圖譜;
步驟2:基于數據列之間的值完全匹配形成數據關聯元數據知識圖譜;
步驟3:基于數據庫的模式信息形成數據庫模式元數據知識圖譜;
步驟4:基于步驟1、2和3獲得的三個知識圖譜,將各個知識圖譜中相同實體組成的三元組關系進行對齊,匯總成完整的數據庫元數據關系知識圖譜;
步驟5:使用基于表示的知識推理模型對步驟4獲得的完整知識圖譜進行推理,對圖譜中的關系進行補全,進一步完善數據庫元數據關系知識圖譜。
2.根據權利要求1所述的一種數據庫元數據關系知識圖譜生成方法,其特征在于,所述數據庫的模式信息為表和列的定義信息。
3. 根據權利要求1所述的一種數據庫元數據關系知識圖譜生成方法,其特征在于,所述步驟1具體為:基于數據庫的歷史SQL查詢語句,對形式為select … from Ta join Tb onTa.Cx= Tb.Cy以及select … from Ta, Tb where Ta. Cx =Tb. Cy的查詢語句,構建表間歷史查詢關系三元組(Ta,history_table_match,Tb)以及列間歷史查詢關系三元組(Ta. Cx,history_column_match,Tb. Cy),形成歷史查詢元數據知識圖譜。
4. 根據權利要求1所述的一種數據庫元數據關系知識圖譜生成方法,其特征在于,所述步驟2具體為:
基于數據列之間的值完全匹配,對于每一個數據列Ta. Cx,將其與數據庫中其他表的所有列Tb. Cy填充入如下的SQL模板中進行查詢,select count(*) from Ta,Tb where Ta. Cx=Tb. Cy
當查詢結果超過閾值時,則構建形式為(Ta. Cx,column_value_match,Tb. Cy)的三元組,形成數據關聯元數據知識圖譜。
5.根據權利要求1所述的一種數據庫元數據關系知識圖譜生成方法,其特征在于,所述步驟3具體為:于數據庫的模式信息,定義表和列之間的關系,形成數據庫模式元數據知識圖譜。
6.根據權利要求1所述的一種數據庫元數據關系知識圖譜生成方法,其特征在于,所述所述步驟4包含以下子步驟:
步驟401:對于歷史查詢元數據知識圖譜的三元組,若兩個列實體之間存在歷史匹配關系Rh,則以Rh替換數據關聯圖譜、數據庫模式圖譜中這兩個列實體的三元組的關系;
步驟402:對于歷史查詢元數據知識圖譜的三元組,若兩個表實體存在歷史查詢關系Re,則以Re替換數據庫模式圖譜中這兩個表實體的三元組的關系;
步驟403:對于數據關聯性圖譜中的三元組,若兩個列實體間存在數據關聯關系Rv,同時在歷史查詢圖譜中這兩個列實體間沒有關系,則以Rv替換數據庫模式圖譜中這兩個列實體之間的關系;
步驟404:將按照步驟401、402和403對齊后的三個知識圖譜,匯總形成完整的數據庫元數據關系知識圖譜。
7.根據權利要求1所述的一種數據庫元數據關系知識圖譜生成方法,其特征在于,所述步驟5包括以下子步驟:
步驟501:對完整的數據庫元數據關系知識圖譜中的三元組按照9:1的比例分為訓練集和測試集,用訓練集數據訓練一個基于表示的知識推理模型TransE,并用測試集驗證訓練效果以決定何時停止訓練;
步驟502:使用訓練好的TransE對完整的數據庫元數據關系知識圖譜進行知識推理,對圖譜中的關系進行補全,形成更為完善的數據庫元數據關系知識圖譜。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于電子科技大學,未經電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210508938.9/1.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





