[發明專利]用戶畫像構建方法有效
| 申請號: | 201510965619.0 | 申請日: | 2015-12-22 |
| 公開(公告)號: | CN105608171B | 公開(公告)日: | 2018-12-11 |
| 發明(設計)人: | 孫東;楊彬;李言芹;呂曉華 | 申請(專利權)人: | 青島海貝易通信息技術有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 青島中天匯智知識產權代理有限公司 37241 | 代理人: | 郝團代 |
| 地址: | 266101 山東省青島市*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用戶 畫像 構建 方法 | ||
本發明提出一種用戶畫像構建方法,首先通過分布式爬蟲爬取互聯網各類數據并融合打通形成海量知識庫;然后獲取的上網日志并將上網日志與知識庫進行匹配生成用戶基礎標簽;結合電信運營商特有的客戶關系管理(CRM)數據及地理位置數據構建用戶屬性標簽;對標簽數據進行權重及衰減因子處理生成用戶基礎畫像,并且可以結合行業用戶的特征及行業客戶數據做個性化的數據挖掘,生成符合行業應用的用戶畫像并對外提供服務。本發明的優點在于能夠為客戶提供精確的全網用戶畫像,充分利用互聯網數據,為用戶分析、產品推薦、精準營銷等應用服務提供方便。
技術領域
本發明涉及通信技術領域,具體涉及一種用戶畫像構建方法。
背景技術
用戶畫像,是一種用于勾畫目標用戶、聯系用戶訴求與設計方向的有效工具,其在各領域均得到了廣泛的應用。例如,具體實現時,可以將用戶畫像作為用于刻畫用戶特征的標簽(tag) 集合,比如,包括年齡、性別等靜態屬性,也包括用戶的興趣特征,如旅游、服飾等。用戶畫像的構建和更新對于后續的信息的定向傳播,比如廣告的定向投放有著重要的意義。
目前的互聯網行業中,構建用戶畫像的方法一般是根據用戶在站內的行為,如將訪問的媒體類目、商品類目等行為日志保存下來,然后,在一定時間窗口內,遍歷所有的用戶行為日志,按照某種權重衰減函數對其進行計算,得到當前最新的用戶畫像。該方式存在的問題是獲取的數據非常片面,僅有該站內的用戶數據,對于用戶在其他網站上的訪問行為則一無所知;同時,對于互聯網行業來說,難以做到用戶實名注冊,所以對于年齡、性別等用戶靜態屬性只能通過相關統計算法進行猜測,可靠性不高。
并且,目前各方數據持有者的用戶數據基本都是封閉的,未能在全網層面打通共享各數據孤島。這就對數據使用者造成無法在全網范圍內準確了解用戶的行為偏好、并結合其行業需求對數據進行個性化的數據挖掘,對生成符合行業應用的用戶畫像造成一定困難。
發明內容
本發明的目的是針對上述構建用戶畫像時,數據片段化、數據封閉等原因造成用戶畫像不夠精準等技術問題提出的一種用戶畫像構建方法。通過建立精確的全網統一用戶畫像,方便客戶進行用戶分析、產品推薦、精準營銷等應用服務。
為了達到上述目的,本發明提出一種用戶畫像構建方法,包括如下步驟:
步驟S1:建立知識庫:獲取互聯網各類數據,并將獲取的互聯網數據進行融合打通形成知識庫;
步驟S2:獲取用戶的上網日志;
步驟S3:構建用戶基礎標簽:將上述上網日志與所述知識庫進行匹配形成用戶基礎標簽;
步驟S4:構建用戶屬性標簽:結合電信運營商的CRM數據及地理位置數據構建用戶屬性標簽;
步驟S5:計算標簽數據:對上述基礎標簽和屬性標簽進行標簽的權重及衰減因子處理;
步驟S6:根據上述標簽數據生成用戶畫像。
進一步的,所述步驟S6中,還可以針對行業用戶要求,結合行業用戶及行業客戶數據進行個性化數據挖掘,構建符合行業應用的用戶畫像。
進一步的,所述步驟S1中,獲取互聯網各類數據時采用分布式爬蟲爬取方式,所述分布式爬蟲采用主從模式部署。主控節點將用戶設置的URL抓取任務分發到各爬蟲節點,爬蟲節點負責具體的網頁下載解析任務。
進一步的,所述步驟S1中,將互聯網數據融合打通時,首先對互聯網數據細化類別,然后進行標簽自動歸并,將類別進行統一。
進一步的,所述步驟S5中,對標簽進行權重處理時,總的標簽權重采用如下公式計算:W=觸媒權重*行為權重*訪問頻度,所述觸媒權重指不同網站其區分用戶特征的重要性,行為權重指的是用戶不同行為對于區分用戶意向的重要性。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于青島海貝易通信息技術有限公司,未經青島海貝易通信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510965619.0/2.html,轉載請聲明來源鉆瓜專利網。





