[發明專利]跨多數據表的數據處理方法、裝置、介質和計算設備有效
| 申請號: | 201710866877.2 | 申請日: | 2017-09-22 |
| 公開(公告)號: | CN108268586B | 公開(公告)日: | 2020-06-16 |
| 發明(設計)人: | 李光明 | 申請(專利權)人: | 阿里巴巴(中國)有限公司 |
| 主分類號: | G06F16/22 | 分類號: | G06F16/22;G06F16/2458 |
| 代理公司: | 上海知錦知識產權代理事務所(特殊普通合伙) 31327 | 代理人: | 湯陳龍 |
| 地址: | 310052 浙江省杭州市濱江*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 多數 數據處理 方法 裝置 介質 計算 設備 | ||
1.一種跨多數據表的數據處理方法,其特征在于,包括:
獲取多個第一數據表,所述多個第一數據表中的每個第一數據表的每一行包括對象標識和所述對象標識所標識的對象的多個特征數據;
將多個第一數據表中每個第一數據表的每一行轉換為一個子數據表,所述子數據表的每一行包括所述對象標識和所述對象標識所標識的對象的一個特征數據,所述第一數據表對應的子數據表構成第二數據表;
以第二數據表中的特征數據為連接鍵,對每個第一數據表對應的第二數據表進行表連接,得到目標數據表,其中,所述目標數據表中的每一行包括一個特征數據,以及所述特征數據對應的至少一個對象標識。
2.根據權利要求1所述的方法,其特征在于,所述將多個第一數據表中每個第一數據表的每一行轉換為一個子數據表,包括:
根據所述第一數據表的每一行包括的多個特征數據,將所述第一數據表的每一行拆分成包括多行的子數據表,所述子數據表的行數與所述多個特征數據的個數相同。
3.根據權利要求1所述的方法,其特征在于,所述以第二數據表中的特征數據為連接鍵,對每個第一數據表對應的第二數據表進行表連接,得到目標數據表,包括:
從每個第一數據表對應的第二數據表中選擇一個第二數據表作為主表,將剩余的第二數據表作為從表,以每個所述第二數據表中的特征數據為連接鍵,將所述從表左連接至所述主表,得到目標數據表。
4.根據權利要求1所述的方法,其特征在于,所述方法,還包括:
以所述目標數據表中的特征數據為依據,確定所述目標數據表中來自于不同的第一數據表中的對象標識所標識的對象之間的關聯關系。
5.根據權利要求4所述的方法,其特征在于,所述確定來自于不同的第一數據表中的對象標識所標識的對象之間的關聯關系,包括:
確定所述目標數據表中多個對象標識所標識的對象之間具有的相同特征數據的數量,所述多個對象標識分別來自于多個不同的所述第一數據表。
6.根據權利要求4所述的方法,其特征在于,所述確定來自于不同的第一數據表中的對象標識所標識的對象之間的關聯關系,包括:
確定所述目標數據表中與目標特征數據對應的來自于不同的所述第一數據表的數據標識所標識的對象;或者
確定所述目標數據表中與目標對象對應有相同特征數據的其他對象的對象標識。
7.根據權利要求4-6任一項所述的方法,其特征在于,所述以所述目標數據表中的特征數據為依據,確定所述目標數據表中來自于不同的第一數據表中的對象標識所標識的對象之間的關聯關系,包括:
獲取目標任務,所述目標任務包括:確定所述目標數據表中來自于不同的第一數據表中的對象標識所標識的對象之間的關聯關系;
根據所述目標任務,將所述目標數據表以所述特征數據為主鍵映射為多個規約任務,通過分布式運算所述多個規約任務完成所述目標任務。
8.一種跨多數據表的數據處理裝置,其特征在于,包括:
獲取模塊,用于獲取多個第一數據表,所述多個第一數據表中的每個第一數據表的每一行包括對象標識和所述對象標識所標識的對象的多個特征數據;
轉換模塊,用于將多個第一數據表中每個第一數據表的每一行轉換為一個子數據表,所述子數據表的每一行包括所述對象標識和所述對象標識所標識的對象的一個特征數據,所述第一數據表對應的子數據表構成第二數據表;
連接模塊,用于以第二數據表中的特征數據為連接鍵,對每個第一數據表對應的第二數據表進行表連接,得到目標數據表,其中,所述目標數據表中的每一行包括一個特征數據,以及所述特征數據對應的至少一個對象標識。
9.根據權利要求8所述的裝置,其特征在于,所述轉換模塊包括:
數據表拆分單元,用于根據所述第一數據表的每一行包括的多個特征數據,將所述第一數據表的每一行拆分成包括多行的子數據表,所述子數據表的行數與所述多個特征數據的個數相同。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于阿里巴巴(中國)有限公司,未經阿里巴巴(中國)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710866877.2/1.html,轉載請聲明來源鉆瓜專利網。





