[發明專利]一種保險電商平臺用戶流失預測的方法和裝置在審
| 申請號: | 201811462728.0 | 申請日: | 2018-12-03 |
| 公開(公告)號: | CN109583651A | 公開(公告)日: | 2019-04-05 |
| 發明(設計)人: | 張玖琳;房鵬展 | 申請(專利權)人: | 焦點科技股份有限公司 |
| 主分類號: | G06Q10/04 | 分類號: | G06Q10/04;G06Q10/06;G06Q30/02;G06Q30/06;G06Q40/08 |
| 代理公司: | 南京瑞弘專利商標事務所(普通合伙) 32249 | 代理人: | 陳建和 |
| 地址: | 210032 江蘇省南京*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 模型效果 平臺用戶 原始數據 預處理 規約 方法和裝置 策略設計 分類管理 概率預測 數據參考 數據倉庫 特征描述 網站客戶 營銷效果 影響用戶 用戶分類 用戶規則 用戶群體 預測算法 精細化 數據集 用戶群 預測 準確率 整合 算法 保險 存儲 輸出 衡量 營銷 概率 評估 觀察 分析 | ||
1.一種保險電商平臺用戶流失預測的方法,其特征是,包括如下步驟:
步驟1:對網站客戶原始數據收集,根據用戶規則存儲于數據倉庫中;
步驟2:對原始數據進行清理、整合以及規約預處理,在集成后的數據集上進一步提取衡量用戶價值的變量,用于用戶細分;
步驟3:選擇合理的觀察變量以及合適的用戶細分算法進行用戶分類;
步驟4:針對不同的用戶群體選取相應的影響用戶流失的變量,分別進行用戶流失概率預測;
步驟5:對于不同類別的用戶分別選擇不同的預測算法,通過準確率、召回率等指標對模型效果評估,當模型效果達到最優后,輸出不同類別的用戶的最終流失概率;
步驟6:對不同類別的流失用戶群分類管理,分別進行群特征描述,可為挽回策略設計提供數據參考,進而實現精細化營銷,后續進行營銷效果分析。
2.根據權利要求1所述的保險電商平臺用戶流失預測的方法,其特征是,步驟1中:從數據庫中全面的對網站客戶原始數據收集,包括客戶的訪問行為數據、購買記錄和基本屬性等,數據整理成以客戶唯一標示身份為維度,包括交易行為、基本屬性等業務數據以用戶ID為單位存儲,用戶訪問日志類數據會以cookie為單位存儲;
步驟2中:對原始數據進行清理、規約以及整合預處理,包括清理部分保險網站的測試賬號數據,避免對實際預測造成干擾,通過用戶ID和cookie之間的對應關系將步驟1中的各類數據整合,統一按客戶ID存儲,生成用戶的基本數據寬表,進一步將原來“粗”的數據集通過計算集成為衡量用戶價值和影響流失的變量,包括消費頻率、近期訪問PV,為后續的用戶細分和流失預測做準備;
步驟3中:選擇合理的觀察變量以及合適的用戶細分算法進行用戶價值分類,在RFM模型的三個指標:最近購買時間、購買頻率、總購買金額的基礎上新增指標用戶分享次數;根據保險類行業特點,通過統計分析,得保險網站訪問用戶的購買轉化率只有1.07%,但是來自于推薦或者分享的用戶購買轉化率達到11.59%;選擇最近購買時間、購買頻率、總購買金額、用戶分享次數4個變量作為用戶價值細分的參量集,通過對衡量用戶價值的這4個變量兩兩重要性作比較,構造出參量之間重要度的判斷矩陣A,
利用幾何平均法對矩陣A44計算對應的權重,依次為w1、w2、w3、w4,也能根據實際情況做微調;
由各個參量的權重、參量值計算每個用戶的價值指標;有
Y=w1X1+w2X2+…+w4X4
其中Xi為用戶的具體變量值,對應最近購買時間、購買頻率、總購買金額、用戶分享次數,wi為變量Xi所對應的權重;
對矩陣A44一致性檢驗通過后,利用幾何平均法,即
其中,i=1,2,…,4,得權重w=(w1,w2,w3,w4),再對具體指標標準化,得每個用戶的價值指標得分;
依據用戶的價值指標采用聚類算法進行用戶分類,采用的是k-means算法進行聚類,根據具體業務數據聚類結果可以適當的調整k值;保險業務行業出于對客戶細分管理,根據RFM模型將用戶細分為8類,但是出于用戶分類的基礎上進行流失預測,也可將8類客戶粗分為3類,這里可以通過步驟4最終的流失預測效果進行比較,如果效果差不多,則將k值設為3,保證預測效果的同時減少工作量,如果效果有明顯差異,則優先選擇預測流失效果更好的k值,所以最終設置k值等于3,即將用戶聚為高價值用戶、中價值用戶、低價值用戶,其中高價值表明用戶對整個電商平臺的整體價值貢獻高;
步驟4中:分別針對不同的用戶群體選取相應的影響用戶流失的變量,根據步驟3的用戶群特征,分析出高價值用戶購買的產品屬性多偏向于價格高、保障期限長,低價值用戶購買的產品屬性多偏向性價比高,且這類用戶對于促銷敏感度比較高,會經常關注網站的專題活動,因此影響高價值用戶流失的訪問行為特征的觀察時間范圍明顯要高于影響低價值用戶流失的訪問行為特征的觀察時間范圍,具體時段依據實際業務數據而定。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于焦點科技股份有限公司,未經焦點科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811462728.0/1.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





