[發明專利]高級自適應數據庫匹配的方法和系統在審
| 申請號: | 202110527636.1 | 申請日: | 2021-05-14 |
| 公開(公告)號: | CN113688177A | 公開(公告)日: | 2021-11-23 |
| 發明(設計)人: | B·賴曼;A·海利;N·巴德;A·巴德拉賈;K·K·梅格哈尼;J·維爾瑪;K·C·辛加拉布 | 申請(專利權)人: | 赫克斯岡技術中心;赫克斯岡能力中心印度私人有限公司 |
| 主分類號: | G06F16/25 | 分類號: | G06F16/25;G06F16/28 |
| 代理公司: | 北京三友知識產權代理有限公司 11127 | 代理人: | 王萬影;王小東 |
| 地址: | 瑞士赫*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 高級 自適應 數據庫 匹配 方法 系統 | ||
本發明涉及高級自適應數據庫匹配的方法和系統。在示例實施方式中,公開了一種關聯來自多個數據庫的數據的方法。該方法包括訪問包含第一數據集的第一數據庫和包含第二數據集的第二數據庫。該方法還包括識別分別與所述第一數據集和所述第二數據集相對應的第一表達式集合和第二表達式集合。該方法還包括確定分別與所述第一數據庫和所述第二數據庫相對應的第一集群集合和第二集群集合。此外,該方法包括基于關系集合和基于所述第一集群集合和所述第二集群集合確定的映射函數來創建關系數據庫。
技術領域
本公開總體上涉及數據庫管理,并且具體地涉及自適應數據庫匹配。
背景技術
為了描述給定域中和跨給定工作流的相同實體,可以根據不同利益相關者定義或采用的標準和分類法使用不同的文本描述。例如,在大型工業設施的資產生命周期管理中產生的給定工作項目中,代表扮演不同角色的不同公司或集團的利益相關者(例如,承包商、供應商、運營商、工程師等)可以使用不同的命名法來定義同一對象。作為示例,在與建筑工地管理有關的給定數據庫中,列出工業對象的工具可以使用唯一的ID(也稱為商品代碼)對數據進行編目。在更具體的示例中,在工廠加工行業中,從工程、采購和施工的角度來看,設計工具按照設計標準來利用目錄和規范,其中,組件由此類代碼唯一標識。這些商品代碼是通過遵循唯一描述數據點的一組預定義規則和標準來編寫的。然而,用戶可以選擇引入自定義的規則集合、語法、分類法和標準來描述相同的對象。此外,在某些情況下,可以使用組件的結構化描述。但是這些商品代碼始終遵循規則集合的假設可能不適用于其他系統,并且例如,在某些情況下也可以使用非結構化描述。
當具有此類代碼清單描述的數據庫很大時,對代碼列表描述進行匹配可能是一項繁瑣的任務,并且跨數據庫的組件或部件的識別和跟蹤成為復雜、基于技能和耗時的過程。為了增加復雜性,構成任何組件的定義的設計屬性也可能在定義組件的屬性的順序和數量方面有所不同。此外,對于縮寫詞和首字母縮略詞沒有標準約定,這使得問題過于復雜,無法利用簡單的表/字典/查找表來解決。
因此,需要一種克服以上缺陷中的至少一者的解決方案。
發明內容
提供本概述是為了以簡化的格式介紹一些概念,這些概念將在本發明的具體實施方式中進一步描述。該概述既不旨在標識本發明的關鍵或必要的發明構思,也不旨在確定本發明的范圍。
在示例實施方式中,公開了一種關聯來自多個數據庫的數據的方法。該方法包括訪問第一數據庫和第二數據庫,其中,所述第一數據庫包括按照第一模式與多個對象相關聯的對象描述的第一數據集,并且其中,所述第二數據庫包括按照第二模式與所述多個對象相關聯的對象描述的第二數據集。該方法還包括識別分別與所述第一數據集和所述第二數據集相對應的第一表達式集合和第二表達式集合,其中,所述第一表達式集合和所述第二表達式集合中的每個表達式包括使用字母數字字符編碼的至少一個條目并且定義了來自所述多個對象的對象的屬性。該方法還包括基于以下中的至少一者來確定分別與所述第一數據庫和所述第二數據庫相對應的第一集群集合和第二集群集合:與所述多個對象相關聯的域數據、與所述多個對象相關聯的對象類別、域規則集合、所述第一表達式集合和所述第二表達式集合,其中,所述第一集群集合中的每個集群包括來自所述多個對象的對應的第一上下文相似對象集合,并且所述第二集群集合中的每個集群包括來自所述多個對象的對應的第二上下文相似對象集合。該方法還包括得出分別為第一數據庫的第一集群集合與第二數據庫的第二集群集合之間的映射函數。此外,該方法包括利用映射函數來創建關系數據庫。這里,所述關系數據庫包括以下中的至少一者之間的映射:所述第一集群集合和所述第二集群集合、所述第一表達式集合和所述第二表達式集合、所述第一上下文相似對象集合和所述第二上下文相似對象集合、以及所述第一模式和所述第二模式。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于赫克斯岡技術中心;赫克斯岡能力中心印度私人有限公司,未經赫克斯岡技術中心;赫克斯岡能力中心印度私人有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110527636.1/2.html,轉載請聲明來源鉆瓜專利網。





