[發明專利]用戶畫像唯一標識生成方法在審
| 申請號: | 202210166925.8 | 申請日: | 2022-02-23 |
| 公開(公告)號: | CN114579673A | 公開(公告)日: | 2022-06-03 |
| 發明(設計)人: | 汪凡;李翔 | 申請(專利權)人: | 深圳市惟客數據科技有限公司 |
| 主分類號: | G06F16/28 | 分類號: | G06F16/28 |
| 代理公司: | 廣州嘉權專利商標事務所有限公司 44205 | 代理人: | 張志輝 |
| 地址: | 518000 廣東省深圳市南山區粵海街道海珠社區海德*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用戶 畫像 唯一 標識 生成 方法 | ||
1.一種用戶畫像唯一標識生成方法,其特征在于,包括:
響應于生成請求,從多個目標數據源獲取第一數據及第二數據,為所述第一數據和所述第二數據添加第一唯一標識,所述第一數據和所述第二數據分別用于表征歷史數據和預設時間段內的新增數據;
根據所述第一數據及所述第二數據,確定目標標識字段;
根據所述目標標識字段,確定第一數據集,所述第一數據集用于表征所述目標標識字段的點關系;
根據所述第一數據集,確定第二數據集,所述第二數據集用于表征所述第一數據集的字段的線性關系;
根據所述第一數據集和第二數據集,確定第三數據集,所述第三數據集用于表征所述目標標識字段對應的實體關系;
根據所述第三數據集中的所述第一唯一標識確定目標唯一標識。
2.根據權利要求1所述的用戶畫像唯一標識生成方法,其特征在于,所述從多個目標數據源獲取第一數據及第二數據,為所述第一數據和所述第二數據添加第一唯一標識,包括:
獲取所述第一數據,為所述第一數據的每條數據添加所述第一唯一標識,并寫入目標表;
獲取所述第二數據,對所述第二數據的每條數據添加所述第一唯一標識。
3.根據權利要求1所述的用戶畫像唯一標識生成方法,其特征在于,所述根據所述第一數據及所述第二數據,確定目標標識字段包括:
解析所述第一數據及所述第二數據,獲取對應的字段;
根據字段的數據來源選取多個字段作為所述目標標識字段,所述目標標識字段按字段權重進行排序。
4.根據權利要求3所述的用戶畫像唯一標識生成方法,其特征在于,所述根據所述目標標識字段,確定第一數據集,包括:
根據第一預設規則,以及根據所述字段權重依次查找所述目標標識字段是否為空,將權重最高且不為空的所述目標標識字段,作為用戶標識,根據用戶標識生成所述第一數據集,所述第一數據集為點RDD數據集。
5.根據權利要求4所述的用戶畫像唯一標識生成方法,其特征在于,所述根據所述第一數據集,確定第二數據集,包括:
獲取所述第一數據集的多個字段,根據所述第一預設規則生成所述第二數據集,其中所述第二數據集為邊數據集。
6.根據權利要求5所述的用戶畫像唯一標識生成方法,其特征在于,所述根據所述第一數據集和第二數據集,確定第三數據集,包括:
以所述點RDD數據集和所述邊數據集繪制得到所述第三數據集,所述第三數據集為圖數據集,所述點RDD數據集、所述邊數據集及所述圖數據集中的字段均具有對應的哈希碼。
7.根據權利要求6所述的用戶畫像唯一標識生成方法,其特征在于,所述根據所述第三數據集確定目標唯一標識,包括:
根據查找所述第一數據和所述第二數據中是否包括所述第一唯一標識;
若存在所述第一唯一標識,則將所述第一唯一標識作為所述目標唯一標識;
若不存在所述第一唯一標識,則添加所述目標唯一標識;
若存在多個所述第一唯一標識,則將所述第一唯一標識中的所述目標標識字段依照字段權重進行選取。
8.一種用戶畫像唯一標識生成裝置,其特征在于,包括:
數據獲取模塊,用于響應于生成請求,從多個目標數據源獲取第一數據及第二數據,為所述第一數據和所述第二數據添加第一唯一標識,所述第一數據和所述第二數據分別用于表征歷史數據和預設時間段內的新增數據;
目標標識字段模塊,用于根據所述第一數據及所述第二數據,確定目標標識字段;
第一數據集模塊,用于根據所述目標標識字段,確定第一數據集,所述第一數據集用于表征所述目標標識字段的點關系;
第二數據集模塊,用于根據所述第一數據集,確定第二數據集,所述第二數據集用于表征所述第一數據集的字段的線性關系;
第三數據集模塊,用于根據所述第一數據集和第二數據集,確定第三數據集,所述第三數據集用于表征所述目標標識字段對應的實體關系;
目標唯一標識模塊,用于根據所述第三數據集中的所述第一唯一標識確定目標唯一標識。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳市惟客數據科技有限公司,未經深圳市惟客數據科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210166925.8/1.html,轉載請聲明來源鉆瓜專利網。





