[發明專利]基于人工智能的留存預測方法、裝置、計算機設備及介質在審
| 申請號: | 202010898938.5 | 申請日: | 2020-08-31 |
| 公開(公告)號: | CN112036641A | 公開(公告)日: | 2020-12-04 |
| 發明(設計)人: | 張巧麗;林榮吉 | 申請(專利權)人: | 中國平安人壽保險股份有限公司 |
| 主分類號: | G06Q10/04 | 分類號: | G06Q10/04;G06Q10/10;G06N20/10 |
| 代理公司: | 深圳市賽恩倍吉知識產權代理有限公司 44334 | 代理人: | 何春蘭;遲珊珊 |
| 地址: | 518000 廣東省深圳市福田區益田路503*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 人工智能 留存 預測 方法 裝置 計算機 設備 介質 | ||
1.一種基于人工智能的留存預測方法,其特征在于,所述方法包括:
對全量樣本進行分箱處理得到多個分箱特征值;
從所述全量樣本中選取多個批樣本,并根據所述多個分箱特征值計算每個批樣本的布爾矩陣;
初始化樹模型,并采用第一遺忘機制基于當前批樣本的樣本標識向量更新所述樹模型中節點的樣本統計量;
采用第二遺忘機制基于所述當前批樣本的樣本標識向量及對應的布爾矩陣計算所述當前批樣本的信息增益矩陣;
根據所述當前批樣本的信息增益矩陣更新當前最優特征及所述當前最優特征的特征值;
基于所述當前最優特征及所述當前最優特征的特征值迭代訓練所述樹模型得到留存預測模型;
使用所述留存預測模型基于待測用戶的樣本數據進行預測得到所述待測用戶的留存時長。
2.如權利要求1所述的基于人工智能的留存預測方法,其特征在于,所述采用第一遺忘機制基于當前批樣本的樣本標識向量更新所述樹模型中節點的樣本統計量包括:
判斷所述節點是否為根節點;
當所述節點為根節點,設置所述當前批樣本的樣本標識向量為第一標識向量,其中,所述第一標識向量中的元素值均為1;
當所述節點不為根節點時,設置所述當前批樣本的樣本標識向量為第二標識向量,其中,所述第二標識向量中的元素值包括0和1,1代表所述樣本由所述根節點分配給所述節點,0代表所述樣本由所述根節點分配給其他節點;
確定所述當前批樣本之前的每一個批樣本相對于所述當前批樣本的相對批次,根據所述相對批次與預設第一系數計算所述批次對應的批樣本的統計量的第一乘積;
根據所述當前批樣本的統計量與所述當前批樣本之前的每一個批樣本對應的第一乘積更新所述當前批樣本的統計量。
3.如權利要求1所述的基于人工智能的留存預測方法,其特征在于,所述根據所述多個分箱特征值計算每個批樣本的布爾矩陣包括:
對于任意一個批樣本,采用預設計算模型計算所述任意一個批樣本中的每個樣本與每個分箱特征值的第一布爾矩陣;
將每個樣本對應的多個第一布爾矩陣進行連接得到第二布爾矩陣,作為所述樣本的布爾矩陣;
將所述任意一個批樣本對應的多個第二布爾矩陣進行連接得到第三布爾矩陣,作為所述任意一個批樣本的布爾矩陣。
4.如權利要求3所述的基于人工智能的留存預測方法,其特征在于,所述預設計算模型為:其中,X為樣本的特征值,A為分箱特征值,T為樣本在該特征值下的最小特征值,為向下取整函數。
5.如權利要求1所述的基于人工智能的留存預測方法,其特征在于,在根據所述當前批樣本的信息增益矩陣更新當前最優特征及所述當前最優特征的特征值之前,所述方法還包括:
獲取與所述當前最優特征對應的歷史最優特征;
獲取所述歷史最優特征的特征值;
計算所述當前最優特征的特征值與所述歷史最優特征的特征值之間的信息增益差值;
判斷信息增益差值是否小于預設差值閾值;
當所述信息增益差值小于所述預設差值閾值時,將所述歷史最優特征作為所述當前最優特征,所述歷史最優特征的特征值作為所述當前最優特征的特征值。
6.如權利要求1至5中任意一項所述的基于人工智能的留存預測方法,其特征在于,所述對全量樣本進行分箱處理得到多個分箱特征值包括:
采用預設分箱數對全量樣本進行分箱處理得到多個分裂點;
將所述多個分裂點作為多個分箱特征值。
7.如權利要求1至5中任意一項所述的基于人工智能的留存預測方法,其特征在于,所述基于所述當前最優特征及所述當前最優特征的特征值迭代訓練所述樹模型得到留存預測模型包括:
獲取所述樹模型輸出的預測值;
計算所述預測值與對應的樣本的真實值之間的預測誤差;
判斷所述預測誤差是否小于預設誤差閾值;
當所述預測誤差大于所述預設誤差閾值時,從所述全量樣本中重新選取多個批樣本,并重新訓練所述留存預測模型,直至所述預測誤差小于預設誤差閾值,停止訓練所述留存預測模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國平安人壽保險股份有限公司,未經中國平安人壽保險股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010898938.5/1.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





