[發(fā)明專利]針對數(shù)據(jù)偏移的目標(biāo)對象行為預(yù)測方法及其相關(guān)設(shè)備有效
| 申請?zhí)枺?/td> | 202011487422.8 | 申請日: | 2020-12-16 |
| 公開(公告)號: | CN112508118B | 公開(公告)日: | 2023-08-29 |
| 發(fā)明(設(shè)計)人: | 張巧麗;林榮吉 | 申請(專利權(quán))人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06F18/2113 | 分類號: | G06F18/2113;G06F18/214;G06F18/243;G06N5/01;G06Q10/04;G06Q10/1053;G06Q40/08 |
| 代理公司: | 深圳市世聯(lián)合知識產(chǎn)權(quán)代理有限公司 44385 | 代理人: | 汪琳琳 |
| 地址: | 518000 廣東省深圳市福田區(qū)福*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 針對 數(shù)據(jù) 偏移 目標(biāo) 對象 行為 預(yù)測 方法 及其 相關(guān) 設(shè)備 | ||
1.一種針對數(shù)據(jù)偏移的目標(biāo)對象行為預(yù)測方法,其特征在于,包括下述步驟:
獲取與目標(biāo)對象的行為相關(guān)的歷史數(shù)據(jù),從所述歷史數(shù)據(jù)中提取多個維度的特征變量,并對所述特征變量進(jìn)行預(yù)處理;
對預(yù)處理后的所述特征變量進(jìn)行特征篩選,生成第一特征變量集合和第二特征變量集合,其中所述第一特征變量集合中各特征變量跨時間的預(yù)測穩(wěn)定性均高于所述第二特征變量集合中各特征變量跨時間的預(yù)測穩(wěn)定性;
對所述第二特征變量集合進(jìn)行二次篩選得到第三特征變量集合,對所述第三特征變量集合和所述第一特征變量集合中的特征變量采用不同的賦值方式分別進(jìn)行權(quán)重賦值;
根據(jù)所述第一特征變量集合和對應(yīng)的權(quán)重對預(yù)設(shè)的LightGBM樹模型進(jìn)行訓(xùn)練,得到第一訓(xùn)練模型并輸出第一訓(xùn)練結(jié)果,根據(jù)所述第一特征變量集合、所述第三特征變量集和對應(yīng)的權(quán)重對預(yù)設(shè)的LightGBM樹模型進(jìn)行訓(xùn)練,得到第二訓(xùn)練模型并輸出第二訓(xùn)練結(jié)果;
當(dāng)所述第二訓(xùn)練結(jié)果與所述第一訓(xùn)練結(jié)果的比較結(jié)果滿足預(yù)設(shè)條件時,輸出所述第二訓(xùn)練模型,基于所述第一特征變量集合、所述第三特征變量集和所述第二訓(xùn)練模型對目標(biāo)對象的行為進(jìn)行預(yù)測。
2.根據(jù)權(quán)利要求1所述的針對數(shù)據(jù)偏移的目標(biāo)對象行為預(yù)測方法,其特征在于,所述方法還包括:
當(dāng)所述第二訓(xùn)練結(jié)果與所述第一訓(xùn)練結(jié)果的比較結(jié)果不滿足預(yù)設(shè)條件時,調(diào)整所述第三特征變量集合中的特征變量對應(yīng)的權(quán)重系數(shù),基于所述權(quán)重系數(shù)得到所述第三特征變量集合中的特征變量的新的權(quán)重,再基于新的權(quán)重進(jìn)行模型訓(xùn)練,之后進(jìn)行所述第一訓(xùn)練結(jié)果和所述第二訓(xùn)練結(jié)果的比較,直到所述比較結(jié)果滿足所述預(yù)設(shè)條件。
3.根據(jù)權(quán)利要求2所述的針對數(shù)據(jù)偏移的目標(biāo)對象行為預(yù)測方法,其特征在于,所述對預(yù)處理后的所述特征變量進(jìn)行特征篩選,生成第一特征變量集合和第二特征變量集合包括:
將所述特征變量在多個時間段的樣本數(shù)據(jù)作為訓(xùn)練樣本集,并獲取所述特征變量在目標(biāo)時間段的樣本數(shù)據(jù)作為預(yù)測樣本集,基于所述訓(xùn)練樣本集和所述預(yù)測樣本集計算所述特征變量的IV值和PSI值,從原始特征變量集中篩選出所述IV值和所述PSI值滿足第一閾值組的特征變量,生成第一特征變量集,并從所述原始特征變量集剩余的特征變量中篩選出所述IV值和所述PSI值滿足第二閾值組的特征變量,生成第二特征變量集。
4.根據(jù)權(quán)利要求3所述的針對數(shù)據(jù)偏移的目標(biāo)對象行為預(yù)測方法,其特征在于,所述IV值包括逐月IV值和逐月IV均值,所述對所述第二特征變量集合進(jìn)行二次篩選得到第三特征變量集合包括:
基于多個擬合函數(shù)對所述第二特征變量集合中的各特征變量的逐月IV進(jìn)行曲線擬合,對每個特征變量生成多條預(yù)測能力波動曲線;
依次將每個特征變量作為當(dāng)前特征變量,對所述當(dāng)前特征變量的多條預(yù)測能力波動曲線的擬合均方根誤差進(jìn)行對比,判斷最小的擬合均方根誤差與當(dāng)前特征變量的逐月IV均值的比值是否大于預(yù)設(shè)閾值,若大于則進(jìn)一步判斷所述當(dāng)前特征變量的各逐月IV值是否單調(diào),并在不單調(diào)時將所述當(dāng)前特征變量剔除。
5.根據(jù)權(quán)利要求4所述的針對數(shù)據(jù)偏移的目標(biāo)對象行為預(yù)測方法,其特征在于,所述IV值還包括整體IV值,所述對所述第三特征變量集合和所述第一特征變量集合中的特征變量采用不同的賦值方式分別進(jìn)行權(quán)重賦值包括:
對所述第一特征變量集合中的特征變量賦予預(yù)設(shè)的固定權(quán)重;
對所述第三特征變量集合中所述比值不大于所述預(yù)設(shè)閾值的特征變量,根據(jù)所述最小的擬合均方根誤差對應(yīng)的預(yù)測能力波動曲線,求取其在所述目標(biāo)時間段的IV值,基于得到的IV值和所述整體IV值進(jìn)行權(quán)重賦值;
對第三特征變量集合中所述比值大于所述預(yù)設(shè)閾值、且對應(yīng)的所述逐月IV值單調(diào)的特征變量,根據(jù)其距所述目標(biāo)時間段最近的兩個時間段的IV值求取其在所述目標(biāo)時間段的IV值,基于得到的IV值和所述整體IV值進(jìn)行權(quán)重賦值。
6.根據(jù)權(quán)利要求1至3任一項所述的針對數(shù)據(jù)偏移的目標(biāo)對象行為預(yù)測方法,其特征在于,對所述特征變量進(jìn)行預(yù)處理進(jìn)行預(yù)處理包括:對所述特征變量的樣本數(shù)據(jù)依次進(jìn)行數(shù)據(jù)清洗、數(shù)據(jù)變量分箱和數(shù)值化編碼操作。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于平安科技(深圳)有限公司,未經(jīng)平安科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011487422.8/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 目標(biāo)檢測裝置、學(xué)習(xí)裝置、目標(biāo)檢測系統(tǒng)及目標(biāo)檢測方法
- 目標(biāo)監(jiān)測方法、目標(biāo)監(jiān)測裝置以及目標(biāo)監(jiān)測程序
- 目標(biāo)監(jiān)控系統(tǒng)及目標(biāo)監(jiān)控方法
- 目標(biāo)跟蹤方法和目標(biāo)跟蹤設(shè)備
- 目標(biāo)跟蹤方法和目標(biāo)跟蹤裝置
- 目標(biāo)檢測方法和目標(biāo)檢測裝置
- 目標(biāo)跟蹤方法、目標(biāo)跟蹤裝置、目標(biāo)跟蹤設(shè)備
- 目標(biāo)處理方法、目標(biāo)處理裝置、目標(biāo)處理設(shè)備及介質(zhì)
- 目標(biāo)處理方法、目標(biāo)處理裝置、目標(biāo)處理設(shè)備及介質(zhì)
- 目標(biāo)跟蹤系統(tǒng)及目標(biāo)跟蹤方法





