[發明專利]一種基于動態探針的實體關聯挖掘方法有效
| 申請號: | 202110302533.5 | 申請日: | 2021-03-22 |
| 公開(公告)號: | CN112966027B | 公開(公告)日: | 2022-10-21 |
| 發明(設計)人: | 陶冶;郭帥童;丁香乾;侯瑞春;李輝;史操 | 申請(專利權)人: | 青島科技大學 |
| 主分類號: | G06F16/2458 | 分類號: | G06F16/2458;G06F16/28;G06F40/242;G06F40/253;G06F40/30;G06K9/62 |
| 代理公司: | 青島聯智專利商標事務所有限公司 37101 | 代理人: | 邵新華 |
| 地址: | 266061 山*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 動態 探針 實體 關聯 挖掘 方法 | ||
本發明公開了一種基于動態探針的實體關聯挖掘方法,包括配置探針偵聽應用系統對數據庫的交互數據;對偵聽到的數據進行處理,形成一個實體的格式化數據存入關系型數據庫;將所述實體與關系型數據庫中的已有實體進行特征融合,分別計算兩個對比實體的屬性信息的相似度、屬性值的相似度、日志相似度;然后將計算得到的屬性信息相似度、屬性值相似度以及日志相似度,使用模糊邏輯推理方法得出兩個對比實體的相似程度,實現實體之間的關聯匹配。本發明采用基于動態探針的實體關聯挖掘方法,獲取企業業務和數據庫存儲的相關數據,通過多維特征度量不同實體之間的相似性,并采用模糊邏輯推理方法給出實體之間的最佳匹配結果,由此可以節省人工匹配時間。
技術領域
本發明屬于數據管理技術領域,具體地說,是涉及一種在異構信息系統中實現實體之間關聯性的挖掘方法。
背景技術
隨著企業業務開發與信息化建設的發展,各類業務系統的數據庫中積累了海量數據,這些數據通常具有多源、異構、自治等特點。采用恰當的數據融合技術將分散在多個系統中的碎片化數據集成為一個全面、準確的企業數據空間,有助于打破各系統之間的信息孤島,為深入挖掘數據關聯關系、構建知識圖譜、實現數據全面高效共享提供有效支持。
跨系統的實體關聯是數據整合過程中的重要一環。通常,在傳統的數據倉庫構建中,實現跨系統的實體關聯匹配要經歷多個流程,數據庫管理人員根據業務人員提出的需求獲取相應的數據,此外對數據的分析處理通常需要相關背景的專業人員進行協助,以手動的方式對實體之間的關聯進行確認匹配。例如在A系統中某一表中的price字段,與B系統中某一表中的unit_price字段,實際上描述的是某一產品的價格與隸屬于該產品的某一零部件的價格,零部件的價格高低直接影響著產品的價格漲落,因此兩個字段的數據信息之間存在緊密的關聯性。但是,就目前的技術而言,這一相關性的發現與匹配通常是通過手動模式來實現的。在具有一定規模的業務系統中,實體屬性通常數以千計,完全依靠人工發現數據之間的關聯性是一件十分耗費時間的任務。
此外,隨著企業業務的不斷發展,也使得實體關聯匹配結果存在滯后性,需要隨具體情況不斷進行調整。如果能自動地實現實體之間關聯性的發現與匹配,將節省相關人員的人工匹配時間。
發明內容
本發明的目的在于提供一種基于動態探針的實體關聯挖掘方法,可以對實體之間各屬性的關聯性實現自動發現和匹配。
為解決上述技術問題,本發明采用以下技術方案予以實現:
一種基于動態探針的實體關聯挖掘方法,包括以下過程:
配置探針,偵聽應用系統對數據庫的請求信息及對應的響應數據;
對偵聽到的數據進行處理,形成一個實體的格式化數據存入關系型數據庫;
將所述實體與關系型數據庫中的已有實體進行特征融合,過程為:
計算兩個對比實體的屬性信息的相似度;
計算兩個對比實體的屬性值的相似度;
計算兩個對比實體的日志相似度;
將計算得到的屬性信息相似度、屬性值相似度以及日志相似度,使用模糊邏輯推理方法,得出兩個對比實體的相似程度。
與現有技術相比,本發明的優點和積極效果是:本發明采用基于動態探針的實體關聯挖掘方法,獲取企業業務和數據庫存儲的相關數據,通過多維特征度量不同實體之間的相似性,并采用模糊邏輯推理方法給出實體之間的最佳匹配結果,提供給相關人員作為參考,由此可以節省相關人員的人工匹配時間,提高工作效率。
結合附圖閱讀本發明實施方式的詳細描述后,本發明的其他特點和優點將變得更加清楚。
附圖說明
圖1為本發明所提出的基于動態探針的實體關聯挖掘方法的一種實施例的總體架構圖;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于青島科技大學,未經青島科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110302533.5/2.html,轉載請聲明來源鉆瓜專利網。





