[發(fā)明專利]一種基于拒絕推斷的金融違約風險評估方法及系統(tǒng)在審
| 申請?zhí)枺?/td> | 202011132733.2 | 申請日: | 2020-10-21 |
| 公開(公告)號: | CN112488817A | 公開(公告)日: | 2021-03-12 |
| 發(fā)明(設計)人: | 段建鋼;鄧詩哲;李瑞 | 申請(專利權)人: | 上海旻浦科技有限公司 |
| 主分類號: | G06Q40/02 | 分類號: | G06Q40/02;G06F16/215;G06F16/2458 |
| 代理公司: | 上海恒慧知識產(chǎn)權代理事務所(特殊普通合伙) 31317 | 代理人: | 張寧展 |
| 地址: | 200120 上海市浦東新區(qū)中國*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 拒絕 推斷 金融 違約 風險 評估 方法 系統(tǒng) | ||
1.一種基于拒絕推斷的金融違約風險評估方法,其特征在于,包括:
S1,獲取接受申請用戶和拒絕申請用戶的數(shù)據(jù),對數(shù)據(jù)進行預處理,分別形成接受樣本和拒絕樣本,統(tǒng)計接受樣本和拒絕樣本的共有特征維度;將信用還款記錄作為標簽,將接受樣本分為違約正樣本和非違約負樣本,構建具有標簽的接受樣本,并形成訓練數(shù)據(jù)集;
S2,利用S1中得到的訓練數(shù)據(jù)集中的數(shù)據(jù)學習特征表示模型,利用學習后的特征表示模型生成具有標簽的接受樣本和拒絕樣本的特征表示結果;
S3,利用S2中得到的特征表示結果訓練拒絕推斷模型,利用訓練后的拒絕推斷模型,根據(jù)S1中得到的訓練數(shù)據(jù)集中的數(shù)據(jù)推斷拒絕樣本的標簽,構建具有標簽的拒絕樣本,并加入到S1中得到的訓練數(shù)據(jù)集中;
S4,利用S3中得到的訓練數(shù)據(jù)集訓練風險評估模型;
利用訓練完成的風險評估模型,對新申請者的違約概率進行計算,進而得到風險評估結果。
2.根據(jù)權利要求1所述的基于拒絕推斷的金融違約風險評估方法,其特征在于,所述S1中:將現(xiàn)有數(shù)據(jù)劃分為已有信用還款記錄的接受申請用戶數(shù)據(jù)和無借貸還款記錄的拒絕申請用戶數(shù)據(jù),預處理后分別形成接受樣本和拒絕樣本;將信用還款記錄作為標簽,有違約記錄的接受樣本為正樣本,無違約記錄的接受樣本為負樣本,以此構建具有標簽的接受樣本,并形成訓練數(shù)據(jù)集。
3.根據(jù)權利要求1或2所述的基于拒絕推斷的金融違約風險評估方法,其特征在于,所述預處理包括:數(shù)據(jù)清洗、特征選擇、特征編碼和/或不平衡處理。
4.根據(jù)權利要求1或2所述的基于拒絕推斷的金融違約風險評估方法,其特征在于,所述統(tǒng)計接受樣本和拒絕樣本的共有特征維度,包括:
選擇接受樣本和拒絕樣本的共有特征;
對共有特征進行類別特征劃分和數(shù)值特征劃分;
對劃分后的特征分別進行相應的缺失值和異常值處理;
對處理后的特征進行特征工程操作,得到共有特征維度。
5.根據(jù)權利要求1所述的基于拒絕推斷的金融違約風險評估方法,其特征在于,所述S2中:利用多層感知器作為特征表示模型,將具有標簽的接受樣本和拒絕樣本作為模型的輸入,輸出為樣本特征向量;輸出的樣本特征向量滿足同標簽樣本間的距離足夠近,不同標簽樣本間的距離足夠遠,其中,距離的度量方式是歐式距離,得到特征表示結果。
6.根據(jù)權利要求1所述的基于拒絕推斷的金融違約風險評估方法,其特征在于,所述S3中,利用經(jīng)過受約束的半監(jiān)督聚類模型作為拒絕推斷模型,將帶標簽的接受樣本和無標簽的拒絕樣本作為輸入,通過聚類結果推斷出拒絕樣本的標簽。
7.根據(jù)權利要求1所述的基于拒絕推斷的金融違約風險評估方法,其特征在于,所述S4中,利用邏輯回歸信用評分模型作為風險評估模型,將具有標簽的接受樣本和利用拒絕推斷模型推斷出標簽的拒絕樣本共同作為輸入,輸出為新用戶的違約概率。
8.一種基于拒絕推斷的金融違約風險評估系統(tǒng),其特征在于,包括:
樣本處理模塊,所述樣本處理模塊獲取接受申請用戶和拒絕申請用戶的數(shù)據(jù),對數(shù)據(jù)進行預處理,分別形成接受樣本和拒絕樣本,統(tǒng)計接受樣本和拒絕樣本的共有特征維度;將信用還款記錄作為標簽,將接受樣本分為違約正樣本和非違約負樣本,構建具有標簽的接受樣本,并形成訓練數(shù)據(jù)集;
特征表示模塊,所述特征表示模塊利用樣本處理模塊中得到的訓練數(shù)據(jù)集中的數(shù)據(jù)學習特征表示模型,利用學習后的特征表示模型生成具有標簽的接受樣本和拒絕樣本的特征表示結果;
拒絕推斷模塊,拒絕推斷模塊利用特征表示模塊中得到的特征表示結果訓練拒絕推斷模型,利用訓練后的拒絕推斷模型,根據(jù)樣本處理模塊中得到的訓練數(shù)據(jù)集中的數(shù)據(jù)推斷拒絕樣本的標簽,構建具有標簽的拒絕樣本,并加入到樣本處理模塊中得到的訓練數(shù)據(jù)集中,對訓練數(shù)據(jù)集進行更新;
風險評估模塊,所述風險評估模塊利用更新后的訓練數(shù)據(jù)集訓練風險評估模型,利用訓練完成的風險評估模型,對新申請者的違約概率進行計算,進而得到風險評估結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海旻浦科技有限公司,未經(jīng)上海旻浦科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011132733.2/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預測目的的數(shù)據(jù)處理系統(tǒng)或方法;其他類目不包含的專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預測目的的處理系統(tǒng)或方法
G06Q40-00 金融;保險;稅務策略;公司或所得稅的處理
G06Q40-02 .銀行業(yè),例如,利息計算、信貸審批、抵押、家庭銀行或網(wǎng)上銀行
G06Q40-04 .交易,例如,股票、商品、金融衍生工具或貨幣兌換
G06Q40-06 .投資,例如,金融工具、資產(chǎn)組合管理或者基金管理
G06Q40-08 .保險,例如,風險分析或養(yǎng)老金





