[發(fā)明專利]一種貸后行為特征加工的方法與裝置在審
| 申請?zhí)枺?/td> | 202110429088.9 | 申請日: | 2021-04-21 |
| 公開(公告)號: | CN112927071A | 公開(公告)日: | 2021-06-08 |
| 發(fā)明(設(shè)計(jì))人: | 尚朝;徐英浩;陳樹華 | 申請(專利權(quán))人: | 頂象科技有限公司 |
| 主分類號: | G06Q40/02 | 分類號: | G06Q40/02;G06F16/901;G06F16/906 |
| 代理公司: | 北京云科知識產(chǎn)權(quán)代理事務(wù)所(特殊普通合伙) 11483 | 代理人: | 張飆 |
| 地址: | 311121 浙江省杭州市余杭*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 行為 特征 加工 方法 裝置 | ||
1.一種貸后行為特征加工的方法,其特征在于,所述方法包括以下步驟:
數(shù)據(jù)采集與清洗,獲取整個系統(tǒng)中所需的數(shù)據(jù)對象,進(jìn)行數(shù)據(jù)清洗,所述數(shù)據(jù)清洗為特征工程處理;
貸后行為特征衍生,對清洗后的用戶貸后表現(xiàn)數(shù)據(jù)依次進(jìn)行特征分類、特征分組匯總和特征分組后統(tǒng)計(jì)并衍生出可解釋的匯總字段;
結(jié)果輸出,將數(shù)據(jù)采集與清洗步驟和貸后行為特征衍生步驟中獲取到的所有特征進(jìn)行匯總,通過用戶號碼進(jìn)行關(guān)聯(lián)合并,完成后作為結(jié)果輸出。
2.根據(jù)權(quán)利要求1所述的貸后行為特征加工的方法,其特征在于,數(shù)據(jù)采集與清洗步驟中,獲取整個系統(tǒng)中所需的數(shù)據(jù)對象,包含用戶的貸后行為類、申請貸款類、app操作行為類、第三方數(shù)據(jù)類和/或內(nèi)部數(shù)據(jù)類;其中貸后行為類特征包括:訂單基本信息、還款行為、逾期行為和/或催收行為;申請貸款類包含用戶基本情況、申請記錄和/或授信信息;app操作類為app中埋點(diǎn)數(shù)據(jù);第三方數(shù)據(jù)包括征信、多頭、從第三方機(jī)構(gòu)獲取的數(shù)據(jù)。內(nèi)部數(shù)據(jù)類包括機(jī)構(gòu)內(nèi)部保存的信用卡、理財(cái)儲蓄、商城消費(fèi)、生活繳費(fèi)、和/或關(guān)聯(lián)網(wǎng)絡(luò)特征。
3.根據(jù)權(quán)利要求1所述的貸后行為特征加工的方法,其特征在于,數(shù)據(jù)采集與清洗步驟中,數(shù)據(jù)清洗包括無量綱化處理、缺失值處理、異常值處理和離散數(shù)據(jù)處理。
4.根據(jù)權(quán)利要求3所述的貸后行為特征加工的方法,其特征在于,
所述無量綱化處理是使不同規(guī)格的數(shù)據(jù)轉(zhuǎn)換到同一規(guī)格,采用標(biāo)準(zhǔn)化的方法;
所述缺失值處理,對于缺失比例在50%以下的,通過平均數(shù)、中位數(shù)或眾數(shù)進(jìn)行填充,缺失比例在50%以上90%以下的,使用負(fù)數(shù)填充;對于缺失比例在90%以上且沒有業(yè)務(wù)含義的直接刪除該字段,有業(yè)務(wù)含義的加入業(yè)務(wù)規(guī)則中;
所述異常值處理,利用箱線圖法計(jì)算出可接受范圍內(nèi)的數(shù)值,在可接受范圍外的數(shù)值認(rèn)為是異常值;對異常值的樣本進(jìn)行刪除,或者進(jìn)行異常值替換;
所述離散數(shù)據(jù)處理,是將類別型數(shù)據(jù)轉(zhuǎn)化為可以放入模型進(jìn)行計(jì)算的數(shù)值;將字符串類型的特征進(jìn)行one-hot-encoding處理。
5.根據(jù)權(quán)利要求4所述的貸后行為特征加工的方法,其特征在于,所述異常值處理步驟中,采用適用于連續(xù)數(shù)據(jù)的無監(jiān)督異常檢測方法的孤立森林算法代替箱線圖法。
6.根據(jù)權(quán)利要求1所述的貸后行為特征加工的方法,其特征在于,在貸后行為特征衍生步驟中,包含以下三個步驟;其中,
第一步,特征分類,將特征分為四類,第一類為次數(shù)、期數(shù)、或天數(shù)特征;第二類是與金額特征;第三類是貸款時間特征,包括用戶每筆借款的借款時間、放款時間、分期訂單的每期還款時間、逾期時間或逾期還款時間;第四類是時間窗口統(tǒng)計(jì)特征,包括設(shè)定時間內(nèi)借款情況和逾期情況;
第二步,特征分組匯總,對于一個用戶名下的N筆貸款訂單,對各個訂單分別匯總為N個訂單特征,再將N個訂單特征匯總成所述用戶的特征;
第三步,對于特征分組后統(tǒng)計(jì),并衍生出用戶級別的特征,其中統(tǒng)計(jì)方法包括統(tǒng)計(jì)學(xué)分析法、占比分析法、差距計(jì)算法、和/或混合計(jì)算法。
7.根據(jù)權(quán)利要求6所述的貸后行為特征加工的方法,其特征在于,
所述統(tǒng)計(jì)學(xué)分析法,是對第二步中分組的特征進(jìn)行統(tǒng)計(jì)分析,求出其統(tǒng)計(jì)學(xué)指標(biāo),包括最大值、最小值、平均值、求和、中位數(shù)、四分之一分位數(shù)、四分之三分位數(shù)、和/或方差;
所述占比分析法,是指計(jì)算各項(xiàng)比例,包括逾期期數(shù)占總期數(shù)的比例、提前還款訂單占總訂單比例、在貸訂單占總訂單比例、逾期金額占總金額的比例、3個月內(nèi)借款金額占總借款金額的比例、和/或1個月內(nèi)逾期天數(shù)大于7天的比例;
所述差距計(jì)算法,是指計(jì)算最早一次借款與最近一次借款的時間差、和/或最高一筆借款金額與最低一筆借款金額的差值;
混合計(jì)算法,是指將上述的三種方法混合使用。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于頂象科技有限公司,未經(jīng)頂象科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110429088.9/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:車輛座椅、部件和方法
- 下一篇:帶有濾盒更換提示裝置的智能防護(hù)面罩
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測目的的數(shù)據(jù)處理系統(tǒng)或方法;其他類目不包含的專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測目的的處理系統(tǒng)或方法
G06Q40-00 金融;保險;稅務(wù)策略;公司或所得稅的處理
G06Q40-02 .銀行業(yè),例如,利息計(jì)算、信貸審批、抵押、家庭銀行或網(wǎng)上銀行
G06Q40-04 .交易,例如,股票、商品、金融衍生工具或貨幣兌換
G06Q40-06 .投資,例如,金融工具、資產(chǎn)組合管理或者基金管理
G06Q40-08 .保險,例如,風(fēng)險分析或養(yǎng)老金





