[發明專利]基于多視圖學習的借貸違約風險檢測方法及相關設備在審
| 申請號: | 202011528313.6 | 申請日: | 2020-12-22 |
| 公開(公告)號: | CN112651821A | 公開(公告)日: | 2021-04-13 |
| 發明(設計)人: | 許天歌 | 申請(專利權)人: | 平安普惠企業管理有限公司 |
| 主分類號: | G06Q40/02 | 分類號: | G06Q40/02;G06K9/62 |
| 代理公司: | 深圳市世聯合知識產權代理有限公司 44385 | 代理人: | 汪琳琳 |
| 地址: | 518000 廣東省深圳市前海深港合作區前*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 視圖 學習 借貸 違約 風險 檢測 方法 相關 設備 | ||
本申請實施例屬于大數據領域,涉及一種基于多視圖學習的借貸違約風險檢測方法,包括將違約檢測數據特征劃分為借款標的特征視圖和借款者特征視圖;基于有標簽樣本和拒絕樣本訓練第一檢測分類器和第二檢測分類器,得到訓練好的第一檢測分類器和第二檢測分類器;根據預設權重策略為訓練好的第一檢測分類器和第二檢測分類器設定投票權重,得到多視圖違約風險檢測模型;將待檢測標的數據輸入到所述多視圖違約風險檢測模型中,得到借貸違約風險檢測結果。采用本方法提高了借貸違約風險檢測準確度。
技術領域
本申請涉及數據處理領域,特別是涉及一種基于多視圖學習的借貸違約風險檢測方法、裝置、計算機設備和存儲介質。
背景技術
在P2P平臺上,借款者發布借款標的的申請,投資者可以根據自己的風險偏好選擇滿意的標的進行投資,若能在標的的籌備期內籌齊所需的借款總額,則該標的中標,即借款成功,這部分樣本也被稱為接收樣本。P2P平臺可以記錄這些借款成功客戶的后續還款信息。若在標的籌集期內未能籌齊借款總額,則該標的流標,即借款失敗,這部分樣本也被稱為拒絕樣本。
基于樣本的還款信息,可以標注樣本的標簽是“違約”還是“非違約”。由于拒絕樣本在申請時被拒絕了,沒有后續還款信息,因此無法標注拒絕樣本的標簽是“違約”還是“非違約”,所以在傳統的違約風險檢測中,通常只使用接受樣本(有標簽樣本)建模。但是由于模型的應用對象是包括接受和拒絕的全部客戶,導致模型構建存在著樣本選擇偏差問題,即訓練模型的樣本和模型檢測的樣本分布不一致。利用有偏樣本訓練違約風險檢測模型,將會傷害模型的泛化能力,從而影響到違約風險檢測效果。此外,P2P平臺中的拒絕樣本的比例通常高于70%,當中含有大量的違約特質,拿給模型學習,可以幫助違約風險檢測,具有一定的違約風險檢測潛力,交給模型學習可以提高模型的違約風險識別能力。隨著訓練樣本量的增加,模型的泛化能力會增強。
目前已有的拒絕推斷方式通常分為兩類:第一類僅使用中標樣本,即有標簽樣本構建違約風險評價模型,然后利用被拒絕的無標簽樣本校正模型中有偏參數,代表方式有Heckman兩階段模型,該類方式由于分布存在較大面積平坦區,平坦區表示對參數識別的弱有效性,從而使得其對違約風險評價模型的改善非常有限。第二類方式首先通過推斷拒絕樣本的標簽來構造接近申請樣本分布的總體樣本,然后給予總提成樣本訓練違約風險檢測模型;代表方式有擴張法、外推法、經驗似然估計法、期望最大化(EM)算法、貝葉斯界定折疊法(BC)以及打包法等等。但是第二類方式對拒絕樣本的推斷過程和違約風險評估過程相互獨立,可能會引入噪音數據(錯誤標記樣本),從而傷害模型的性能。
發明內容
基于此,針對上述技術問題,本申請提供一種基于多視圖學習的借貸違約風險檢測方法、裝置、計算機設備及存儲介質,以解決現有技術中P2P平臺中無法利用無標簽的拒絕樣本矯正樣本選擇偏差來挖掘違約風險檢測潛力、提高違約檢測效果是需要解決的技術問題。
一種基于多視圖學習的借貸違約風險檢測方法,所述方法包括:
將違約檢測數據特征劃分為借款標的特征視圖和借款者特征視圖,其中,所述違約檢測數據特征為歷史標的數據的數據特征;
基于所述借款標的特征視圖的有標簽樣本訓練第一檢測分類器,基于所述借款者特征視圖的有標簽樣本訓練第二檢測分類器,并基于訓練后的第一檢測分類器和第二檢測分類器檢測拒絕樣本的檢測標簽,以及與所述檢測標簽對應的標簽概率;
將檢測標簽一致的拒絕樣本,作為高置信樣本加入候選集,其中,所述候選集中包括有標簽樣本;
將標簽概率作為顯式置信度,并根據從所述候選集中獲取到的顯式置信度高于第一預設值的高置信樣本,對所述第一檢測分類器和所述第二檢測分類器繼續訓練,直到訓練次數達到第二預設值,或者加入到所述候選集中的拒絕樣本的比例占所有有標簽樣本的第三設定值時,訓練結束,得到訓練好的第一檢測分類器和第二檢測分類器;
根據預設權重策略為訓練好的第一檢測分類器和第二檢測分類器設定投票權重,得到多視圖違約風險檢測模型;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安普惠企業管理有限公司,未經平安普惠企業管理有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011528313.6/2.html,轉載請聲明來源鉆瓜專利網。





