[發明專利]單用戶智慧圖譜的構建方法有效
| 申請號: | 201610962361.3 | 申請日: | 2016-10-28 |
| 公開(公告)號: | CN106997371B | 公開(公告)日: | 2020-06-23 |
| 發明(設計)人: | 喬小燕;張瑋;金彤;唐志燕;楊弢;劉曉敏;袁媛 | 申請(專利權)人: | 華數傳媒網絡有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35 |
| 代理公司: | 杭州天昊專利代理事務所(特殊普通合伙) 33283 | 代理人: | 董世博 |
| 地址: | 310000 浙江省杭州市濱*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 單用戶 智慧 圖譜 構建 方法 | ||
本發明公開了單用戶智慧圖譜的構建方法,包括獲取用戶特征集數據、數據標準化、層次聚類、語料庫分類、確定變量的類別歸屬、確定最終9類特征集的順序步驟;單用戶智慧圖譜的構建方法,打破了行業障礙主觀選擇帶來的標簽分類,避免由于主觀選擇而導致標簽的冗余。
技術領域
本發明涉及大數據挖掘領域,更具體的說,它涉及用于單用戶智慧圖譜的構建方法。
背景技術
2001年開始,互聯網真正走向了一個新的里程碑,進入“大數據時代”,通過12、13年的熱炒之后,人們逐漸冷靜下來,更加關注與如何挖掘大數據的潛在商業價值如何在企業中利用大數據技術。伴隨著大數據應用的創新、討論個性化成為其中的一個落腳點。相比于傳統的線下會員治理、問卷調查、購物籃分析,大數據第一次使得企業能夠通過互聯網獲得用戶更為廣泛的反饋信息,為了更精準快速的分析用戶行為習慣和消費習慣等商業信息,必須要提供足夠的基礎數據。隨著對用戶的深入了解,一個概念悄然而生“用戶智慧圖譜”,展現一個用戶的信息全貌,可以作為企業應用大戶數據的根本。
基于行業特性,用戶智慧圖譜特征的劃分有著不同的分類方法,現有的用戶畫像指標體系構建方法是通過對客戶行為特征進行洞察、歸納、推理,提煉出客戶的輪廓。通常情況下,洞察客戶標簽的維度包括:人口統計學特征、社會群體特征、性格心理特征以及業務特征,由此形成客戶標簽體系。
大部分企業采取“3+X”策略進行客戶標簽體系的搭建。其中3是指性別、年齡、收入3個最重要的客戶基礎標簽,X為若干其他標簽,用以輔助對客戶細分的實現。
發明內容
本發明克服了現有技術的不足,提供了一種單用戶智慧圖譜的構建方法,其解決了行業障礙主觀選擇帶來的標簽分類,避免由于主觀選擇而導致標簽的冗余。
本發明的技術方案如下:
單用戶智慧圖譜的構建方法,包括如下步驟:
101,獲取用戶特征集數據,數據來源于用戶日全量表、產品訂購信息表、受理記錄表、設備訂購信息表、資源基本信息表、點播詳單表、客戶日全量表、流失預測表、暫停預測表、呼叫中心日志表、直播數據表等數據表中,形成用戶特征集F={f1,f2,…,fk},所述f1-fk為用戶的各個數據的表;
102,數據標準化,在步驟101之后,對數據進行標準化處理;
103,層次聚類,在步驟102之后,將標準化的數據變量進行層次聚類,將K個變量所屬的類別集合為Cluster={ct1,ct2,…,ct9},所述ct1-ct9為層次聚類后剩下的9個特征的表;
104,語料庫分類,在步驟102之后,將標準化的數據變量進行語料庫分類,將K個變量所屬的類別集合為Classifier={cf1,cf2,…,cf9},所述cf1-cf9為語料庫分類后剩下的9個特征的表;
105,確定變量的類別歸屬,使用RelieF方法分別計算步驟103和104的所得類別集合,用RelieF方法對每一個變量歸屬于Cluster={ct1,ct2,…,ct9},Classifier={cf1,cf2,…,cf9}的權重進行計算,選擇權重較大的特征作為原始變量最終的類別歸屬集合C={c1,c2,…,c9},所述c1-c9為最終類別剩下的9個特征的表;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華數傳媒網絡有限公司,未經華數傳媒網絡有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610962361.3/2.html,轉載請聲明來源鉆瓜專利網。





