[發明專利]狀態分析模型構建方法、分析方法及裝置在審
| 申請號: | 201910141206.9 | 申請日: | 2019-02-25 |
| 公開(公告)號: | CN111612491A | 公開(公告)日: | 2020-09-01 |
| 發明(設計)人: | 楊凱迪;謝梁 | 申請(專利權)人: | 北京嘀嘀無限科技發展有限公司 |
| 主分類號: | G06Q30/02 | 分類號: | G06Q30/02;G06K9/62 |
| 代理公司: | 北京超成律師事務所 11646 | 代理人: | 鄧超 |
| 地址: | 100193 北京*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 狀態 分析 模型 構建 方法 裝置 | ||
本申請實施例提供一種狀態分析模型構建方法、分析方法及裝置,涉及數據處理技術領域。方法包括獲取多個訓練用戶在預設時間段內的訓練特征數據;對訓練特征數據進行分類操作獲得分類結果;對分類結果進行證據權重WoE變換,獲得每一訓練特征數據對應的每一分類的辨識度;利用分類結果構建目標特征的回歸模型,獲得每一訓練特征數據對應的特征系數和截距值;根據辨識度、每一訓練特征數據對應的特征系數和截距值構建狀態分析模型。本申請實施例通過利用狀態分析模型對待測用戶的特征數據進行分析,獲得待測用戶對應的狀態分值,通過狀態分值可以確定待測用戶的狀態信息,因此,本申請實施例能夠針對待測用戶個體進行分析,提高分析的準確性。
技術領域
本申請涉及數據處理技術領域,具體而言,涉及一種狀態分析模型構建方法、分析方法及裝置。
背景技術
針對服務型企業,例如:網約車或外賣等,需對所有的用戶狀態變化進行監控,通過發現用戶狀態的變化,及時進行單體化的策略干預。其中,“用戶沉默預警”即為一個比較常見的狀態監控場景。“用戶沉默預警”是指發現用戶狀態異常,有流失的傾向的用戶的預測。
現有技術中是針對某一類型的用戶構建分析模型,因此其構建的分析模型只能針對某一類型的用戶的狀態進行分析,其對象粒度較大,因此,預測的準確性不高。
發明內容
有鑒于此,本申請實施例的目的在于提供一種狀態分析模型構建方法、分析方法及裝置,以解決上述構建的狀態分析模型分析準確性低的技術問題。
根據本申請的一個方面,提供一種電子設備,可以包括一個或多個存儲介質和一個或多個與存儲介質通信的處理器。一個或多個存儲介質存儲有處理器可執行的機器可讀指令。當電子設備運行時,處理器與存儲介質之間通過總線通信,處理器執行所述機器可讀指令,以執行一個或多個以下操作:
獲取多個訓練用戶在預設時間段內的訓練特征數據;對所述訓練特征數據進行分類操作,獲得分類結果;對所述分類結果進行證據權重WoE變換,獲得每一訓練特征數據對應的每一分類的辨識度;利用所述分類結果構建目標特征的回歸模型,根據所述回歸模型獲得每一訓練特征數據對應的特征系數和截距值;根據所述辨識度、所述每一訓練特征數據對應的特征系數和所述截距值構建所述狀態分析模型。通過該狀態分析模型能夠準確地針對每個待測用戶的狀態進行分析。
在一些實施例中,所述對所述訓練特征數據進行分類操作,獲得分類結果,包括:對連續型的訓練特征數據采用隨機森林映射法進行分類操作,對離散型的訓練特征數據采用Greenacre's分類合并法進行分類操作,獲得分類結果。通過對連續型的訓練特征數據采用隨機森林映射法進行分類,對離散型的訓練特征數據采用Greenacre's分類合并法進行分類,通過迭代的方式優化分類結果,能夠提高狀態分析模型分析的準確性。
在一些實施例中,所述對連續型的訓練特征數據采用隨機森林映射法進行分類操作,包括:對每一連續型的訓練特征數據進行排序,并根據預設深度對排序后的訓練特征數據進行預分類,獲得多個聚合分裂點;計算每一所述聚合分裂點對應的信息增益,將最大的信息增益對應的聚合分裂點作為目標聚合分裂點。通過隨機森林映射法實現了對連續型的訓練特征數據的合理分箱操作。
在一些實施例中,所述計算每一所述聚合分裂點對應的信息增益,包括:利用g(D,A)=H(D)-H(D|A)計算獲得每一聚合分裂點對應的信息增益;其中,H(D)為所述排序后的訓練特征數據的熵,H(A)為通過聚合分裂點A對所述排序后的訓練特征數據進行劃分后的熵。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京嘀嘀無限科技發展有限公司,未經北京嘀嘀無限科技發展有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910141206.9/2.html,轉載請聲明來源鉆瓜專利網。





