[發(fā)明專利]數(shù)據(jù)表的處理方法和裝置有效
| 申請?zhí)枺?/td> | 201610197071.4 | 申請日: | 2016-03-31 |
| 公開(公告)號: | CN107291672B | 公開(公告)日: | 2020-11-20 |
| 發(fā)明(設計)人: | 紀麗娟 | 申請(專利權)人: | 阿里巴巴集團控股有限公司 |
| 主分類號: | G06F40/194 | 分類號: | G06F40/194 |
| 代理公司: | 北京博浩百睿知識產(chǎn)權代理有限責任公司 11134 | 代理人: | 宋子良 |
| 地址: | 英屬開曼群島大開*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數(shù)據(jù)表 處理 方法 裝置 | ||
1.一種數(shù)據(jù)表的處理方法,其特征在于,包括:
比較第一數(shù)據(jù)表中的第一字段和第二數(shù)據(jù)表中的第二字段;
在比較出所述第一字段和所述第二字段的標識信息出現(xiàn)差異的情況下,獲取所述第一字段的加工信息和所述第二字段的加工信息,其中,所述加工信息用于記錄對應字段的加工路徑中的多個加工邏輯;
按照所述加工路徑,比較各個所述對應字段的各個加工邏輯;
若當前比對的加工邏輯不一致,則確定所述當前比對的加工邏輯為出現(xiàn)所述差異的邏輯;
在比較第一數(shù)據(jù)表中的第一字段和第二數(shù)據(jù)表中的第二字段之前,所述方法還包括:獲取待分析數(shù)據(jù)表中每個數(shù)據(jù)表的各個字段的加工信息;利用所述加工信息中的加工邏輯,判斷所述各個字段是否為標識信息相同的字段,得到判斷結果;按照所述判斷結果統(tǒng)計所述待分析數(shù)據(jù)表中兩兩數(shù)據(jù)表之間擁有標識信息相同的字段的個數(shù);基于所述個數(shù)計算所述兩兩數(shù)據(jù)表的相似度;獲取與所述第一數(shù)據(jù)表的相似度符合預設相似度條件的多個第二數(shù)據(jù)表。
2.根據(jù)權利要求1所述的方法,其特征在于,在比較第一數(shù)據(jù)表中的第一字段和第二數(shù)據(jù)表中的第二字段之前,所述方法還包括:
獲取所述第一字段的標識信息,確定所述第二數(shù)據(jù)表中與所述第一字段有相同的標識信息的第二字段。
3.根據(jù)權利要求2所述的方法,其特征在于,所述標識信息包括字段名稱,其中,比較第一數(shù)據(jù)表中的第一字段和第二數(shù)據(jù)表中的第二字段包括:
比較所述第一字段與所述第二字段的字段名稱是否相同;
若所述第一字段和所述第二字段的字段名稱不同,則比較出所述第一字段和所述第二字段的標識信息出現(xiàn)差異。
4.根據(jù)權利要求2所述的方法,其特征在于,所述標識信息包括字段元數(shù)據(jù)和加工邏輯,其中,比較第一數(shù)據(jù)表中的第一字段和第二數(shù)據(jù)表中的第二字段包括:
比較所述第一字段與所述第二字段的字段元數(shù)據(jù)和加工邏輯是否相同;
若所述第一字段和所述第二字段的字段元數(shù)據(jù)和加工邏輯不同,則比較出所述第一字段和所述第二字段的標識信息出現(xiàn)差異。
5.根據(jù)權利要求1所述的方法,其特征在于,利用所述加工信息中的加工邏輯,判斷所述各個字段是否為標識信息相同的字段包括:
若兩個字段的每個加工邏輯一致,則判斷出該兩個字段為所述標識信息相同的字段;
若兩個字段具有不同的加工邏輯,則判斷出該兩個字段為所述標識信息不同的字段。
6.根據(jù)權利要求1所述的方法,其特征在于,在獲取與所述第一數(shù)據(jù)表的相似度符合預設相似度條件的多個第二數(shù)據(jù)表之后,所述方法還包括:
將所述多個第二數(shù)據(jù)表按照健康屬性和質量屬性排序,得到倒序排序信息,
其中,所述健康屬性用于表征數(shù)據(jù)表的資源消耗值,所述質量屬性至少用于表征數(shù)據(jù)表的信息完整和可靠程度。
7.根據(jù)權利要求6所述的方法,其特征在于,在獲取待分析數(shù)據(jù)表中每個數(shù)據(jù)表的各個字段的加工信息之前,所述方法還包括下述至少之一:
接收用于獲取所述第一數(shù)據(jù)表的相似表的推送請求,基于所述推送請求獲取所述待分析數(shù)據(jù)表,其中,所述待分析數(shù)據(jù)表中包括所述第一數(shù)據(jù)表;
接收用于加工數(shù)據(jù)的加工任務,從所述加工任務中提取所述第一數(shù)據(jù)表的標識,利用所述第一數(shù)據(jù)表的標識獲取所述待分析數(shù)據(jù)表;
接收用于清理所述第一數(shù)據(jù)表的清理任務,基于所述清理任務獲取所述待分析數(shù)據(jù)表。
8.根據(jù)權利要求7所述的方法,其特征在于,在得到倒序排序信息之后,所述方法還包括:
在接收到所述推送請求的情況下,將所述倒序排序信息作為響應于所述推送請求的推送信息;
在接收到所述加工任務的情況下,使用所述倒序排序信息中的首個第二數(shù)據(jù)表替換所述加工任務中的第一數(shù)據(jù)表;
在接收到所述清理任務的情況下,將所述倒序排序信息中前q個第二數(shù)據(jù)表與所述第一數(shù)據(jù)表進行合并,其中,q為自然數(shù)。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于阿里巴巴集團控股有限公司,未經(jīng)阿里巴巴集團控股有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610197071.4/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 數(shù)據(jù)表儲存、修改、查詢和統(tǒng)計方法
- 一種基于關聯(lián)規(guī)則的數(shù)據(jù)表分類系統(tǒng)與方法
- 數(shù)據(jù)表儲存、修改、查詢和統(tǒng)計方法
- 一種數(shù)據(jù)識別方法及裝置
- 一種數(shù)據(jù)表切換方法及裝置
- 數(shù)據(jù)表的校驗方法及裝置、電子設備、存儲介質
- 對數(shù)據(jù)集中的數(shù)據(jù)表進行抽樣和校驗的方法及裝置
- 主機中數(shù)據(jù)關聯(lián)訪問的方法和裝置
- 數(shù)據(jù)管理方法、裝置及服務器
- 數(shù)據(jù)處理方法、裝置、設備及計算機可讀存儲介質





