[發明專利]一種基于多數據源的數據處理方法和裝置在審
| 申請號: | 201810122574.4 | 申請日: | 2018-02-07 |
| 公開(公告)號: | CN108415965A | 公開(公告)日: | 2018-08-17 |
| 發明(設計)人: | 龍凱;趙相龍;劉屹州;高瑞鑫 | 申請(專利權)人: | 五維引力(上海)數據服務有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 上海市金茂律師事務所 31299 | 代理人: | 王崢;謝瑞強 |
| 地址: | 201203 上海市浦東新區中國*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 第一數據 地理位置數據 標識數據 方法和裝置 多數據源 空間篩選 篩選條件 時間數據 數據處理 組數據 預設 篩選 數據源 構建 地理 | ||
1.一種基于多數據源的數據處理方法,其特征在于,包括:
從第一數據源獲取第一數據列表并且從第二數據源獲取第二數據列表;其中,第一數據列表的每組數據包括:第一標識數據以及與所述第一標識數據相對應的第一地理位置數據和第一時間數據;第二數據列表的每組數據包括:第二標識數據以及與所述第二標識數據相對應的第二地理位置數據和第二時間數據;
根據空間篩選條件和時間篩選條件對所述第一數據列表和所述第二數據列表進行篩選處理;其中,所述空間篩選條件為:所述第一地理位置數據和所述第二地理位置數據在預設地理范圍之內;所述時間篩選條件為:所述第一時間數據和所述第二時間數據在第一預設時間范圍之內;
根據篩選處理后的所述第一數據列表和所述第二數據列表,構建第三數據列表。
2.根據權利要求1所述的數據處理方法,其特征在于,還包括:
根據所述第三數據列表構建第四數據列表;其中,所述第四數據列表包含所述第三數據列表下的所述第一標識數據與所述第二標識數據的全部組合關系;
計算每組所述第一標識數據與所述第二標識數據的組合的迭代次數;
根據迭代篩選條件對所述第一標識數據與所述第二標識數據的組合進行篩選處理;其中,所述迭代篩選條件為:所述迭代次數超過預設次數閾值;
根據篩選處理后的所述第一標識數據與所述第二標識數據的組合,構建第五數據列表;其中,所述第五數據列表包括:相互具有對應關系的所述第一標識數據和所述第二標識數據。
3.根據權利要求2所述的數據處理方法,其特征在于,根據所述第三數據列表構建第四數據列表的步驟具體包括:
根據n個所述預設地理范圍構建n個所述第三數據列表,并且,在每個所述第三數據列表中將所述第一標識數據與所述第二標識數據進行配對組合,以構建n個所述第四數據列表;
或者,根據m個所述第一預設時間范圍構建m個所述第三數據列表,并且,在每個所述第三數據列表中將所述第一標識數據與所述第二標識數據進行配對組合,以構建m個所述第四數據列表;
或者,根據n個所述預設地理范圍構建n個所述第三數據列表并根據m個所述第一預設時間范圍構建m個所述第三數據列表,并且,在每個所述第三數據列表中將所述第一標識數據與所述第二標識數據進行配對組合以構建n+m個所述第四數據列表;
其中,n個所述預設地理范圍互不重疊,m個所述第一預設時間范圍互不重疊,n為自然數且n≥2,m為自然數且m≥2。
4.根據權利要求2所述的數據處理方法,其特征在于,在構建第四數據列表之后,在計算迭代次數之前,還包括:
根據數據篩選條件對所述第四數據列表的每組數據進行篩選處理;
其中,所述數據篩選條件包括:
所述第一時間數據與所述第二時間數據的差值在第一預設時間差值之內;
和/或,所述第一時間數據和所述第二時間數據在第二預設時間范圍之內;其中,第二預設時間范圍<第一預設時間范圍;
和/或,對于至少兩個所述第二標識數據相同的情況,當所述第二時間數據之間的差值在第二預設時間差值之內時,僅保留其中一個所述第二標識數據;
和/或,丟棄重合數據。
5.根據權利要求1所述的數據處理方法,其特征在于,所述第三數據列表包括:
第一標識數據、第二標識數據、地理標識;
或者,第一標識數據、第二標識數據、地理標識和時間標識;
其中,所述地理標識與所述預設地理范圍相對應,所述時間標識與所述第一預設時間范圍相對應。
6.根據權利要求1至5中任一項所述的數據處理方法,其特征在于,
所述第一標識數據包括:金融賬戶信息或支付軟件賬號信息;
所述第一數據源包括:包含所述金融賬戶信息或所述支付軟件賬號信息的交易數據;
所述第二標識數據包括:終端設備號、應用程序用戶賬號、電話號碼信息、生物特征信息或身份信息;
所述第二數據源包括:包含所述終端設備號、所述應用程序用戶賬號、所述電話號碼信息、所述生物特征信息或所述身份信息的運動軌跡數據。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于五維引力(上海)數據服務有限公司,未經五維引力(上海)數據服務有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810122574.4/1.html,轉載請聲明來源鉆瓜專利網。





