[發(fā)明專利]用戶畫像唯一標識生成方法在審
| 申請?zhí)枺?/td> | 202210166925.8 | 申請日: | 2022-02-23 |
| 公開(公告)號: | CN114579673A | 公開(公告)日: | 2022-06-03 |
| 發(fā)明(設計)人: | 汪凡;李翔 | 申請(專利權)人: | 深圳市惟客數(shù)據(jù)科技有限公司 |
| 主分類號: | G06F16/28 | 分類號: | G06F16/28 |
| 代理公司: | 廣州嘉權專利商標事務所有限公司 44205 | 代理人: | 張志輝 |
| 地址: | 518000 廣東省深圳市南山區(qū)粵海街道海珠社區(qū)海德*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用戶 畫像 唯一 標識 生成 方法 | ||
本發(fā)明提供一種用戶畫像唯一標識生成方法、裝置、電子設備及可讀存儲介質,該用戶畫像唯一標識生成方法包括:從多個目標數(shù)據(jù)源獲取數(shù)據(jù)并添加唯一標識;根據(jù)獲取數(shù)據(jù),確定目標標識字段;根據(jù)目標標識字段,創(chuàng)建數(shù)據(jù)集,依次確定數(shù)據(jù)的點、線及圖關系;根據(jù)數(shù)據(jù)的圖關系確定目標唯一標識。將同一渠道不同時間段上報的用戶標識信息進行記錄,并通過預設格式執(zhí)行轉換成數(shù)據(jù)集,通過數(shù)據(jù)集確定用戶標識信息的變化情況,把不同渠道上報的記錄識別為同一個人,并生成目標唯一標識,無需寫數(shù)據(jù)查詢請求,通過輸入表格式以及輸出表格式,自動生成目標唯一標識,所需要的開發(fā)工作量和時間成本大大降低。
技術領域
本發(fā)明涉及計算機技術領域,尤其涉及一種用戶畫像唯一標識生成方法、裝置、電子設備及可讀存儲介質。
背景技術
同一家公司的客戶可能來自不同的渠道,比如阿里巴巴有支付寶、淘寶等,騰訊有QQ、微信等。每個渠道搜集到的客戶上報的ID種類可能不同。比如:微信小程序獲取到的phone、unionid、openid;支付寶小程序獲取到的phone、unionid、openid;刷臉支付獲取到的phone、feceid;CRM系統(tǒng)獲取到的phone、memberid。各個系統(tǒng)的用戶是相互獨立的,沒辦法掌握與客戶接觸的全貌,也就沒辦法精準的識別客戶的價值。
現(xiàn)有的技術方案根據(jù)ID的關聯(lián)制定規(guī)則,然后使用SQL進行ID的打通,生成One ID(用戶畫像唯一標識),而現(xiàn)有技術通過寫SQL,規(guī)則比較復雜,而且需要定制化開發(fā);根據(jù)公司實際業(yè)務情況的不同,搜集到的ID種類的不同,對應的SQL也需要修改,導致重復的開發(fā)工作;而且維護成本較大。
發(fā)明內容
本發(fā)明實施例的主要目的在于提出一種用戶畫像唯一標識生成方法、裝置、電子設備及可讀存儲介質,實現(xiàn)了用戶畫像唯一標識的生成效率。
本發(fā)明的一方面提供了一種用戶畫像唯一標識生成方法,其特征在于,包括:響應于生成請求,從多個目標數(shù)據(jù)源獲取第一數(shù)據(jù)及第二數(shù)據(jù),為所述第一數(shù)據(jù)和所述第二數(shù)據(jù)添加第一唯一標識,所述第一數(shù)據(jù)和所述第二數(shù)據(jù)分別用于表征歷史數(shù)據(jù)和預設時間段內的新增數(shù)據(jù);根據(jù)所述第一數(shù)據(jù)及所述第二數(shù)據(jù),確定目標標識字段;根據(jù)所述目標標識字段,確定第一數(shù)據(jù)集,所述第一數(shù)據(jù)集用于表征所述目標標識字段的點關系;根據(jù)所述第一數(shù)據(jù)集,確定第二數(shù)據(jù)集,所述第二數(shù)據(jù)集用于表征所述第一數(shù)據(jù)集的字段的線性關系;根據(jù)所述第一數(shù)據(jù)集和第二數(shù)據(jù)集,確定第三數(shù)據(jù)集,所述第三數(shù)據(jù)集用于表征所述目標標識字段對應的實體關系;根據(jù)所述第三數(shù)據(jù)集中的所述第一唯一標識確定目標唯一標識。
根據(jù)本發(fā)明的實施方式,本發(fā)明的技術方案至少具備以下有益效果:將同一渠道不同時間段上報的用戶標識信息進行記錄,并通過預設格式執(zhí)行轉換成數(shù)據(jù)集,通過數(shù)據(jù)集確定用戶標識信息的變化情況,把不同渠道上報的記錄識別為同一個人,并生成目標唯一標識,無需寫數(shù)據(jù)查詢請求,通過輸入表格式以及輸出表格式,自動生成目標唯一標識,所需要的開發(fā)工作量和時間成本大大降低,提高了。
根據(jù)所述的用戶畫像唯一標識生成方法,其中從多個目標數(shù)據(jù)源獲取第一數(shù)據(jù)及第二數(shù)據(jù),為所述第一數(shù)據(jù)和所述第二數(shù)據(jù)添加第一唯一標識,包括:獲取所述第一數(shù)據(jù),為所述第一數(shù)據(jù)的每條數(shù)據(jù)添加所述第一唯一標識,并寫入目標表;獲取所述第二數(shù)據(jù),對所述第二數(shù)據(jù)的每條數(shù)據(jù)添加所述第一唯一標識。
根據(jù)所述的用戶畫像唯一標識生成方法,其中根據(jù)所述第一數(shù)據(jù)及所述第二數(shù)據(jù),確定目標標識字段包括:解析所述第一數(shù)據(jù)及所述第二數(shù)據(jù),獲取對應的字段;根據(jù)字段的數(shù)據(jù)來源選取多個字段作為所述目標標識字段,所述目標標識字段按字段權重進行排序。
根據(jù)所述的用戶畫像唯一標識生成方法,其中根據(jù)所述目標標識字段,確定第一數(shù)據(jù)集,包括:根據(jù)第一預設規(guī)則,以及根據(jù)所述字段權重依次查找所述目標標識字段是否為空,將權重最高且不為空的所述目標標識字段,作為用戶標識,根據(jù)用戶標識生成所述第一數(shù)據(jù)集,所述第一數(shù)據(jù)集為點RDD數(shù)據(jù)集。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳市惟客數(shù)據(jù)科技有限公司,未經(jīng)深圳市惟客數(shù)據(jù)科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210166925.8/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。





