[發明專利]基于多視圖學習的借貸違約風險檢測方法及相關設備在審
| 申請號: | 202011528313.6 | 申請日: | 2020-12-22 |
| 公開(公告)號: | CN112651821A | 公開(公告)日: | 2021-04-13 |
| 發明(設計)人: | 許天歌 | 申請(專利權)人: | 平安普惠企業管理有限公司 |
| 主分類號: | G06Q40/02 | 分類號: | G06Q40/02;G06K9/62 |
| 代理公司: | 深圳市世聯合知識產權代理有限公司 44385 | 代理人: | 汪琳琳 |
| 地址: | 518000 廣東省深圳市前海深港合作區前*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 視圖 學習 借貸 違約 風險 檢測 方法 相關 設備 | ||
1.一種基于多視圖學習的借貸違約風險檢測方法,應用于借貸平臺上,其特征在于,所述方法包括:
將違約檢測數據特征劃分為借款標的特征視圖和借款者特征視圖,其中,所述違約檢測數據特征為歷史標的數據的數據特征;
基于所述借款標的特征視圖的有標簽樣本訓練第一檢測分類器,基于所述借款者特征視圖的有標簽樣本訓練第二檢測分類器,并基于訓練后的第一檢測分類器和第二檢測分類器檢測拒絕樣本的檢測標簽,以及與所述檢測標簽對應的標簽概率;
將檢測標簽一致的拒絕樣本,作為高置信樣本加入候選集,其中,所述候選集中包括有標簽樣本;
將標簽概率作為顯式置信度,并根據從所述候選集中獲取到的顯式置信度高于第一預設值的高置信樣本,對所述第一檢測分類器和所述第二檢測分類器繼續訓練,直到訓練次數達到第二預設值,或者加入到所述候選集中的拒絕樣本的比例占所有有標簽樣本的第三設定值時,訓練結束,得到訓練好的第一檢測分類器和第二檢測分類器;
根據預設權重策略為訓練好的第一檢測分類器和第二檢測分類器設定投票權重,得到多視圖違約風險檢測模型;
將待檢測標的數據輸入到所述多視圖違約風險檢測模型中,得到借貸違約風險檢測結果。
2.根據權利要求1所述的方法,其特征在于,所述將違約檢測數據特征劃分為借款標的特征視圖和借款者特征視圖,包括:
遍歷所述歷史標的數據的違約檢測數據特征,確定各所述違約檢測數據特征之間的關聯關系,其中,所述關聯關系為所述檢測數據特征之間的屬性相似度;
根據所述屬性相似度將所述違約檢測數據特征劃分為借款標的特征視圖和借款者特征視圖。
3.根據權利要求1所述的方法,其特征在于,所述將檢測標簽一致的拒絕樣本,作為高置信樣本加入候選集,包括:
獲取各所述拒絕樣本的所有檢測標簽;
若所述拒絕樣本的所有檢測標簽都為違約或者非違約,則所述拒絕樣本的檢測標簽一致;
若所述拒絕樣本的檢測標簽中既有違約,又有非違約,則所述拒絕樣本的檢測標簽不一致;
將所述檢測標簽一致的拒絕樣本作為高置信樣本加入所述候選集。
4.根據權利要求1所述的方法,其特征在于,所述將標簽概率作為顯式置信度,并根據從所述候選集中獲取到的顯式置信度高于第一預設值的高置信樣本,對所述第一檢測分類器和所述第二檢測分類器繼續訓練,包括:
從所述候選集中獲取所述顯式置信度大于0.5,且小于1的高置信樣本;
將獲取到的高置信樣本從所述候選集中的拒絕樣本中剔除,并將剔除的高置信樣本加入到有標簽樣本中對所述第一檢測分類器和所述第二檢測分類器繼續進行訓練。
5.根據權利要求4所述的方法,其特征在于,所述根據剔除的高置信樣本對所述第一檢測分類器和所述第二檢測分類器繼續進行訓練,包括:
通過邏輯回歸算法計算有標簽樣本的檢測標簽為違約或者非違約的檢測概率,其中,所述邏輯回歸算法包括需要進行擬合的擬合參數;
以損失函數作為目標函數,并計算所述損失函數的損失值;
基于極大似然估計值,通過梯度下降法調整所述擬合參數,得到調整擬合參數后的邏輯回歸算法。
6.根據權利要求1所述的方法,其特征在于,所述根據預設權重策略為訓練好的第一檢測分類器和第二檢測分類器設定投票權重,得到多視圖違約風險檢測模型,包括:
分別為所述第一檢測分類器和所述第二檢測分類器設定0.5的投票權重,得到所述多視圖違約風險檢測模型。
7.根據權利要求1所述的方法,其特征在于,所述待檢測標的數據存儲于區塊鏈中。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安普惠企業管理有限公司,未經平安普惠企業管理有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011528313.6/1.html,轉載請聲明來源鉆瓜專利網。





