[發明專利]一種信審模型的構建方法,裝置及系統在審
| 申請號: | 201810708485.8 | 申請日: | 2018-07-02 |
| 公開(公告)號: | CN110737641A | 公開(公告)日: | 2020-01-31 |
| 發明(設計)人: | 解智;郭汝元;孫樂為;張鋒;喬森;龐敏輝;邱慧 | 申請(專利權)人: | 優估(上海)信息科技有限公司 |
| 主分類號: | G06F16/21 | 分類號: | G06F16/21;G06Q40/02 |
| 代理公司: | 11363 北京弘權知識產權代理事務所(普通合伙) | 代理人: | 逯長明;許偉群 |
| 地址: | 201315 上海市浦東新區中國(上海*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 歷史數據 構建 申請 裝置及系統 貸款能力 集成學習 預測能力 魯棒性 缺失率 時效性 建模 維度 去除 欺詐 篩選 預測 分析 | ||
本申請實施例示出一種信審模型的構建方法,裝置及系統,本申請實施例示出的方案預先將歷史數據進行切分,以及,篩選,去除一些缺失率大的建模個體,以及,一些預測能力較差的特征,將剩余的數據作為特征候選集,基于Logistic Regression的集成學習模型,構建信審模型,采用本申請實施例示出的技術方案可以極大的提升信審的時效性和效率,依托于歷史數據,可以從借貸者的各個方面和維度去分析其貸款能力和還款意愿,能識別出惡意欺詐現象,提高了預測的準確性和魯棒性。
技術領域
本發明涉及計算機技術領域,特別涉及一種信審模型的構建方法,裝置及系統。
背景技術
隨著科學技術的不斷發展,互聯網加行業的快速興起,互聯網加金融也跟上了時代的步伐,網絡借貸已經走進了千家萬戶,借款人能快速的湊齊到資金,同時投資人和擔保人能夠得到比較滿意的收益,平臺上再加入社交思維,創建出了一套完整的在線金融生態體系,當然,隨著平臺業務不斷的擴展和用戶量不斷的上升,以及一些不法份子打著歪主意在平臺上進行欺詐行為,給平臺運營造成了不少困難和損失。
為了減少平臺的損失,信審的過程需要大量的有專業背景知識的人員參與,并需要一定的時間對潛在的借貸者進行信用評估,隨著業務的增長,信審量的增加,傳統的方式在時效性上就很難保證,一些平臺通過對歷史數據的整理與分析,構建信審模型,信審的過程中,申請信息,然后,將申請信息輸入信審模型,最終,信審,模型根據申請信息,輸出一個評價結果。
現有技術示出的信審模型的構建方法,將評價結果與申請信息,同時輸入計算機中,計算機通過申請信息與評價結果的關系構建信審模型,但是由于金融申請信息的獨特性,直接將申請信息與評價結果輸入計算機所構建的模型,采用上述信審模型輸出的評價結果準確度難以保證。
發明內容
本發明的發明目的在于提供一種信審模型的構建方法,裝置及系統,以解現有技術示出的信審模型的構建方法構建的信審模型,其輸出的評價結果準確度難以保證的技術問題。
本申請實施例第一方面示出一種信審模型的構建方法,所述方法包括:
獲取歷史數據,將所述歷史數據切分為數據集,所述數據集包括:訓練集,以及,測試集;
篩選所述數據集,得到特征候選集,所述特征候選集包括:訓練特征候選集,以及,測試特征候選集;
根據所述特征候選集中的特征,以及,評價結果,構建信審模型。
可選擇的,所述篩選數據集,得到特征候選集的步驟包括:
刪除所述數據集中的無用特征,得到待處理數據;
將所述時間格式的數據,轉化為星期特征,得到特征候選集。
可選擇的,所述刪除數據集中的無用特征,得到待處理數據的步驟包括:
統計所述數據集中的預測結果響應值,預測結果未響應值,以及,每個特征的特征響應值,特征未響應值;
根據所述預測結果響應值,預測結果未響應值,以及,特征響應值,特征未響應值,計算出每個特征的WOE值;
判斷所述WOE值是否小于WOE閾值;
如果小于,則將產生所述WOE值的特征確定為無用特征;
刪除所述數據集中的無用特征,得到待處理數據。
可選擇的,所述刪除數據集中的無用特征,得到待處理數據的步驟包括:
統計所述數據集中每個特征的特征響應值,特征未響應值;
根據所述特征響應值,特征未響應值,計算出實際通過概率;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于優估(上海)信息科技有限公司,未經優估(上海)信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810708485.8/2.html,轉載請聲明來源鉆瓜專利網。





