[發(fā)明專利]用于檢測數(shù)據(jù)源中的偏差的方法、設(shè)備和計算機程序有效
| 申請?zhí)枺?/td> | 201380057211.2 | 申請日: | 2013-09-05 |
| 公開(公告)號: | CN104756113B | 公開(公告)日: | 2018-04-20 |
| 發(fā)明(設(shè)計)人: | 帕特里克·古林;安德列斯·托斯滕森 | 申請(專利權(quán))人: | 瑞典愛立信有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 中科專利商標代理有限責(zé)任公司11021 | 代理人: | 穆童 |
| 地址: | 瑞典斯*** | 國省代碼: | 暫無信息 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 用于 檢測 數(shù)據(jù)源 中的 偏差 方法 設(shè)備 計算機 程序 | ||
1.一種用于檢測至少兩個不同數(shù)據(jù)源的數(shù)據(jù)之間的偏差的方法,每一個數(shù)據(jù)源包括多個數(shù)據(jù)公布,每一個數(shù)據(jù)公布包括多個數(shù)據(jù)值,所述方法包括:
標識(102)數(shù)據(jù)公布對,每一對包括第一數(shù)據(jù)源中的第一數(shù)據(jù)公布和第二數(shù)據(jù)源中的第二數(shù)據(jù)公布,其中,針對數(shù)據(jù)公布對中的第一數(shù)據(jù)公布和第二數(shù)據(jù)公布的唯一匹配數(shù)據(jù)屬性,數(shù)據(jù)值的子集相等;
確定(104)所述多個數(shù)據(jù)公布對中的每一個數(shù)據(jù)公布對中的第一數(shù)據(jù)公布的數(shù)據(jù)值和第二數(shù)據(jù)公布的數(shù)據(jù)值的多個組合中的個體組合是否滿足多個關(guān)系模式算法中的個體關(guān)系模式算法;
確定(106)針對所述多個數(shù)據(jù)公布對所確定的關(guān)系模式算法的滿足的符合性水平;
基于所確定的符合性水平,從所述多個關(guān)系模式算法中選擇(108)關(guān)系模式算法;
關(guān)于所選擇的關(guān)系模式算法,分析(110)個體數(shù)據(jù)公布對的數(shù)據(jù)值組合,以檢測個體數(shù)據(jù)公布對中不符合所選擇的關(guān)系模式算法的數(shù)據(jù)值組合,不符合指示(114)個體數(shù)據(jù)公布對的數(shù)據(jù)的可能偏差。
2.根據(jù)權(quán)利要求1所述的方法,其中,所述符合性水平是針對與所述多個數(shù)據(jù)公布對的相同數(shù)據(jù)屬性組合有關(guān)的數(shù)據(jù)值的組合來確定(106)的。
3.根據(jù)權(quán)利要求2所述的方法,其中,確定(104)滿足包括:針對所述多個數(shù)據(jù)公布對中的每一個數(shù)據(jù)公布對,在比較矩陣Hxy中將所述多個數(shù)據(jù)公布對中的每一個數(shù)據(jù)公布對中的第一數(shù)據(jù)公布的數(shù)據(jù)值與第二數(shù)據(jù)公布的數(shù)據(jù)值進行組合,其中,x指示所述第一數(shù)據(jù)公布的數(shù)據(jù)屬性的數(shù)量并且同時指示所述矩陣的列的數(shù)量,y指示所述第二數(shù)據(jù)公布的數(shù)據(jù)屬性的數(shù)量并且同時指示所述矩陣的行的數(shù)量。
4.根據(jù)權(quán)利要求3所述的方法,其中,針對所述多個數(shù)據(jù)公布對,所述相同數(shù)據(jù)屬性組合涉及所述比較矩陣Hxy中的相同位置nab,其中,a=整數(shù)1至x中的任意一個,b=整數(shù)1至y中的任意一個。
5.根據(jù)權(quán)利要求1所述的方法,其中,選擇(108)包括:基于所確定的符合性水平,針對與所述多個數(shù)據(jù)公布對的相同數(shù)據(jù)屬性組合有關(guān)的數(shù)據(jù)值的組合分別選擇關(guān)系模式算法。
6.根據(jù)權(quán)利要求1所述的方法,還包括:
檢測(202)所述第一數(shù)據(jù)源中數(shù)據(jù)值唯一的至少一個數(shù)據(jù)屬性;以及
檢測(204)所述第二數(shù)據(jù)源中數(shù)據(jù)值唯一的至少一個數(shù)據(jù)屬性,以及
從所檢測的所述第一數(shù)據(jù)源中的至少一個數(shù)據(jù)屬性和所檢測的所述第二數(shù)據(jù)源中的至少一個數(shù)據(jù)屬性中選擇(206)所述第一數(shù)據(jù)源中具有最多共同數(shù)據(jù)值的數(shù)據(jù)屬性和所述第二數(shù)據(jù)源中具有最多共同數(shù)據(jù)值的數(shù)據(jù)屬性,作為所述第一數(shù)據(jù)源的唯一匹配數(shù)據(jù)屬性和所述第二數(shù)據(jù)源的唯一匹配數(shù)據(jù)屬性。
7.根據(jù)權(quán)利要求1所述的方法,還包括:
按所述唯一匹配數(shù)據(jù)屬性的數(shù)據(jù)值的遞增或遞減數(shù)據(jù)值順序?qū)λ龅谝粩?shù)據(jù)源和/或所述第二數(shù)據(jù)源中的數(shù)據(jù)公布進行排序。
8.根據(jù)權(quán)利要求1所述的方法,還包括:
針對所述第一數(shù)據(jù)源,通過針對確定所述第一數(shù)據(jù)源的數(shù)據(jù)屬性的數(shù)據(jù)值的特性的值類型算法集暴露數(shù)據(jù)值來檢測(302)所述數(shù)據(jù)屬性的元數(shù)據(jù),
在所述第二數(shù)據(jù)源中,通過針對確定數(shù)據(jù)屬性的數(shù)據(jù)值的特性的值類型算法集暴露數(shù)據(jù)值來檢測(304)所述數(shù)據(jù)屬性的元數(shù)據(jù)。
9.根據(jù)權(quán)利要求6或7或8所述的方法,其中,檢測(302)所述第一數(shù)據(jù)源中的元數(shù)據(jù)包括:檢測(202)所述第一數(shù)據(jù)源中數(shù)據(jù)值唯一的至少一個數(shù)據(jù)屬性,以及檢測(304)所述第二數(shù)據(jù)源中的元數(shù)據(jù)包括:檢測(204)所述第二數(shù)據(jù)源中數(shù)據(jù)值唯一的至少一個數(shù)據(jù)屬性。
10.根據(jù)權(quán)利要求1所述的方法,其中,基于所確定的符合性水平從所述多個關(guān)系模式算法中選擇(108)關(guān)系模式算法僅當所述多個關(guān)系模式算法中存在所確定的符合性水平高于定義閾值的關(guān)系模式算法時才執(zhí)行。
11.根據(jù)權(quán)利要求10所述的方法,其中,當所述多個關(guān)系模式算法中存在多于一個所確定的符合性水平高于所述定義閾值的關(guān)系模式算法時,選擇(108)關(guān)系模式算法包括:使用優(yōu)先級算法來決定選擇所述多于一個關(guān)系模式算法中的哪一個。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于瑞典愛立信有限公司,未經(jīng)瑞典愛立信有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201380057211.2/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 一種數(shù)據(jù)同步處理方法、裝置和單點登錄系統(tǒng)
- 數(shù)據(jù)同步方法和裝置
- 切換數(shù)據(jù)源的方法及系統(tǒng)
- 多數(shù)據(jù)源的數(shù)據(jù)遷移方法
- 數(shù)據(jù)源補充方法、裝置、計算機設(shè)備和存儲介質(zhì)
- 一種數(shù)據(jù)源切換方法及系統(tǒng)
- 一種基于多個數(shù)據(jù)源調(diào)節(jié)工業(yè)自動化的操作系統(tǒng)
- 從不同數(shù)據(jù)源中獲取數(shù)據(jù)的方法、裝置及計算機設(shè)備
- 一種動態(tài)數(shù)據(jù)源查詢方法及裝置
- 一種訪問多數(shù)據(jù)源的方法及系統(tǒng)





