[發明專利]用戶畫像生成方法、裝置、計算機設備和存儲介質在審
| 申請號: | 201811545329.0 | 申請日: | 2018-12-17 |
| 公開(公告)號: | CN109711874A | 公開(公告)日: | 2019-05-03 |
| 發明(設計)人: | 吳元新;馮躍東 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06Q30/02 | 分類號: | G06Q30/02;G06F16/2458;G06F16/25 |
| 代理公司: | 廣州華進聯合專利商標代理有限公司 44224 | 代理人: | 王寧 |
| 地址: | 518033 廣東省深圳市福田區福*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據單元 畫像 字段 數據類型集合 數據轉換模型 特征數據集合 數據類型 特征數據 用戶身份 數據源 數據處理領域 計算機設備 存儲介質 數據格式 特征提取 提取數據 同一用戶 預先定義 拉取 標簽 覆蓋率 合并 轉換 身份 申請 統計 | ||
本申請涉及一種用戶畫像生成方法。涉及數據處理領域,該方法包括:從多個子系統拉取數據源;從數據源中提取數據單元,每個數據單元對應唯一的用戶身份字段;識別數據單元所包含的數據類型,根據數據單元的數據類型統計對應子系統的數據類型集合;根據數據類型集合確定每個子系統對應的數據轉換模型;通過數據轉換模型對相應子系統中的數據單元進行特征提取,并將提取的特征數據轉換成預先定義的數據格式;將多個子系統之間對應同一用戶身份字段的特征數據進行合并,生成每個用戶身份字段對應的特征數據集合;根據特征數據集合生成相應用戶的用戶畫像。采用本方法能夠提高用戶畫像的生成效率且生成的用戶畫像的標簽覆蓋率更高。
技術領域
本申請涉及計算機技術領域,特別是涉及一種用戶畫像生成方法、裝置、計算機設備和存儲介質。
背景技術
隨著電子商務的發展,客戶服務面對的服務對象類型、服務人數等均在大幅增加,行業競爭日趨激烈,如何更好的為用戶提供個性化服務是企業面臨的難題。因此,大數據用戶畫像應運而生,它也稱為用戶角色。傳統應用中都是賴人工的工作經驗,通過人工打標簽的方式生成用戶角色,或者通過對片面數據的簡單的規則判斷來生成用戶角色。無論是人工生成還是簡單的規則化生成均存在生成效率低,標簽覆蓋率低等缺陷。
發明內容
基于此,有必要針對上述技術問題,提供一種能夠提高用戶畫像的生成效率且生成的用戶畫像的標簽覆蓋率更高的用戶畫像生成方法、裝置、計算機設備和存儲介質。
一種用戶畫像生成方法,所述方法包括:
從多個子系統拉取數據源;
從所述數據源中提取數據單元,每個所述數據單元對應唯一的用戶身份字段;
識別所述數據單元所包含的數據類型,根據所述數據單元的數據類型統計對應子系統的數據類型集合;
根據所述數據類型集合確定每個所述子系統對應的數據轉換模型;
通過所述數據轉換模型對相應子系統中的所述數據單元進行特征提取,并將提取的特征數據轉換成預先定義的數據格式;
將所述多個子系統之間對應同一所述用戶身份字段的所述特征數據進行合并,生成每個所述用戶身份字段對應的特征數據集合;
根據所述特征數據集合生成相應用戶的用戶畫像。
在一個實施例中,所述根據所述特征數據集合生成相應用戶的用戶畫像,包括:將所述特征數據集合輸入至標簽生成模型中,輸出所述特征數據集合對應的特征標簽集合,根據所述特征數據集合與所述用戶身份字段之間的對應關系,得到每個所述用戶身份字段對應的特征標簽集合;
根據所述特征標簽集合生成相應用戶的用戶畫像。
在一個實施例中,所述從所述數據源中提取數據單元,每個所述數據單元對應唯一的用戶身份字段,包括:
將對應同一用戶標識的數據組合成數據單元;
查找所述用戶標識是否對應用戶身份字段,若是,將所述用戶身份字段與所述用戶標識對應的所述數據單元關聯;
若否,將所述用戶標識對應的數據單元標記為待實名數據單元;
所述方法還包括:
根據所述待實名數據單元生成待實名用戶的用戶畫像;
從所述用戶畫像中提取用戶特征標簽;
查找與所述用戶特征標簽相匹配的目標用戶畫像,將所述待實名用戶的用戶畫像與所述目標用戶畫像進行合并。
在一個實施例中,所述將所述多個子系統之間對應同一所述用戶身份字段的所述特征數據進行合并,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811545329.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:智能廣告投送方法、裝置、計算機設備及存儲介質
- 下一篇:內容推薦方法及裝置





