[發明專利]大數據金融場景下的基于機器學習和深度學習的保險客戶復購預測方法在審
| 申請號: | 202010744294.4 | 申請日: | 2020-07-29 |
| 公開(公告)號: | CN111899055A | 公開(公告)日: | 2020-11-06 |
| 發明(設計)人: | 楊金鋒;歐陽頎;仇鵬飛 | 申請(專利權)人: | 億達信息技術有限公司 |
| 主分類號: | G06Q30/02 | 分類號: | G06Q30/02;G06Q40/08;G06K9/62;G06N20/10 |
| 代理公司: | 大連東方專利代理有限責任公司 21212 | 代理人: | 徐華燊;李洪福 |
| 地址: | 116000 遼寧*** | 國省代碼: | 遼寧;21 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據 金融 場景 基于 機器 學習 深度 保險 客戶 預測 方法 | ||
1.一種大數據金融場景下的基于機器學習和深度學習的保險客戶復購預測方法,其特征在于,包括如下步驟:
獲取用戶的歷史數據和更新數據,對其進行預處理;
經過數據預處理后的數據作為樣本,利用Logistic模型進行保險客戶是否復購預測建模,得到保險客戶復購預測數據;
利用AdaBoost方法對訓練樣本數據進行訓練,構建弱分類器;
通過各弱分類器分別對所述訓練樣本集進行集成學習得到強分類器;
通過賦予不同弱分類器權重,得到關于產品推薦、復購保費預測和復購保額預測的最終結果。
2.根據權利要求1所述的一種大數據金融場景下的基于機器學習和深度學習的保險客戶復購預測方法,其特征在于,所述對提取的數據進行預處理包括:
對提取的數據進行量化處理;
采用拉格朗日插值方法解決量化處理后缺失的數據;
對數據進行歸一化處理;
對歸一化處理的數據進行pearson相關性驗證,得到用于建模的篩選后的預處理數據。
3.根據權利要求2所述的一種大數據金融場景下的基于機器學習和深度學習的保險客戶復購預測方法,其特征在于,分析用戶的歷史數據和更新數據基于險企已購客戶的保單數據,具體地,提取與業務員、保單基本信息;客戶基本信息;保單、客戶和銷售人員關系信息因素相關的數據;
在經過pearson相關性驗證后,篩選后的數據包括投保姓名,地址,年齡,性別,過往購買記錄及對應金額,銷售渠道,保單生效日,繳費方式,繳費金額,VIP級別,展業機構,代理機構,個人財產估計值,受教育水平,職業,被保人與投保人關系,被保人性別,年齡,職業,身體狀況。
4.根據權利要求1所述的一種大數據金融場景下的基于機器學習和深度學習的保險客戶復購預測方法,其特征在于,所述弱分類器包括邏輯回歸模型、全連接神經網絡多分類器和支持向量機。
5.根據權利要求1所述的一種大數據金融場景下的基于機器學習和深度學習的保險客戶復購預測方法,其特征在于,所述Logistic模型具體為:
邏輯回歸中選擇sigmoid函數作為激活函數,形式如下:
則邏輯回歸輸出的預測函數數學表達式子為
其中θ是參數向量,
預測函數hθ(x)的值含義是對于x結果是1,即復購標簽的概率為hθ(x)=p(y=1|x;θ)
對于二分類問題結果是0,即不復購標簽的概率是1-hθ(x)=p(y=0|x;θ)。
6.根據權利要求5所述的一種大數據金融場景下的基于機器學習和深度學習的保險客戶復購預測方法,其特征在于,預測是否復購算法的具體實施包括建立損失函數、求參數θ向量、損失函數正則化和多類分類,具體地:
為了計算θ參數向量,使用極大然估計得到損失函數和J(θ),公式給出如下:
由以上公式J(θ)取得最小值時θ為要求的最佳參數。
7.根據權利要求6所述的一種大數據金融場景下的基于機器學習和深度學習的保險客戶復購預測方法,其特征在于,利用梯度下降法更新θ,
其中:
為了防止過擬合,需要對J(θ)進行正則化處理,正則化后損失函數J(θ)變為
通過梯度下降法更新θ:
經過以上步驟,將數據預處理后的數據,隨機分配為測試數據和訓練數據,測試數據訓練數據比是2∶8,通過logisticReression預測模型返回維度為客戶數量乘以復購概率的矩陣,矩陣中大于預設值時預測標簽為1,小于預設值時預測標簽為0,實現二分類預測。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于億達信息技術有限公司,未經億達信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010744294.4/1.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





