[發明專利]一種訓練樣本生成方法、裝置、系統和記錄介質在審
| 申請號: | 201910330919.X | 申請日: | 2019-04-23 |
| 公開(公告)號: | CN110147938A | 公開(公告)日: | 2019-08-20 |
| 發明(設計)人: | 代守磊;蘇綏綏;常富洋 | 申請(專利權)人: | 北京淇瑀信息科技有限公司 |
| 主分類號: | G06Q10/06 | 分類號: | G06Q10/06;G06Q40/02;G06K9/62 |
| 代理公司: | 北京清誠知識產權代理有限公司 11691 | 代理人: | 喬東峰 |
| 地址: | 100012 北京市朝陽*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用戶特征 樣本 訓練樣本 樣本屬性 拐點 計算機可讀介質 模型訓練 樣本選擇 信貸 保證 | ||
本發明公開了一種基于用戶特征拐點值的訓練樣本生成方法、裝置、設備和計算機可讀介質。所述方法包括獲取用戶樣本并提取至少一個用戶特征;根據至少一個用戶特征的拐點值進行判斷,以確定用戶樣本屬性,所述屬性包括第一屬性值和第二屬性值;以及根據所述確定用戶樣本屬性的用戶樣本進行模型訓練。本發明能夠在保證樣本準確性的基礎上,縮短樣本選擇時間,提高了信貸用戶的體驗。
技術領域
本發明涉及互聯網應用技術領域,具體涉及一種用于信用評分模型的訓練樣本生成方法、裝置、系統和記錄介質。
背景技術
近年來,隨著機器學習技術在征信領域的進一步應用,應用在征信系統中模型處于多樣化、融合化的階段,對訓練數據的依賴程度高,能較好的滿足機構對于用戶信用的評價需求。現多服務于各類互聯網征信機構、借貸機構,應用較多的是信用評分系統。
信用評分系統通常從已知用戶中選取用戶樣本,根據用戶樣本的行為數據和用戶屬性數據可以提取出用戶樣本的用戶特征,通過用戶樣本的用戶特征對評分模型進行訓練,采用訓練好的評分模型對用戶進行信用評分。
在實現本發明的過程中,發明人發現現有技術至少存在以下問題:
在建立個人信用評分模型時,不僅需要有足夠多的表征信貸申請人信用行為的特征變量,而且建模樣本的容量也必須達到一定的數量。一般來說,樣本容量越大,所建立的模型的精度或預測能力就越高,模型也越穩健,因此往往面臨客戶樣本不足的問題。
此外,在某些場景中,積累樣本數據并訓練模型,從而實現機器學習模型的部署,往往需要較長的時間,如風控模型的觀察期和表現期一般都設定為1年以上,造成申請評分卡模型有著天然的滯后性,因此對用戶信用的評估帶來非常大的影響。
基于現有技術,需要更高效、更準確的模型訓練樣本。
發明內容
鑒于以上所述現有技術的缺點,本發明的目的在于提供一種高效、準確的用戶訓練樣本生成方法。
為解決上述技術問題,本發明的第一方面提出了一種基于用戶特征拐點值的訓練樣本生成方法,包括如下步驟:獲取用戶樣本并提取至少一個用戶特征;根據至少一個用戶特征的拐點值進行判斷,以確定用戶樣本屬性,所述屬性包括第一屬性值和第二屬性值;根據所述確定用戶樣本屬性的用戶樣本進行模型訓練。
根據本發明的一種優選實施方式,所述方法還包括在至少一個用戶特征出現拐點值的時間點進行樣本屬性判斷。
根據本發明的一種優選實施方式,所述拐點值基于至少一個用戶特征進行大數據分析得到。具體為在表現期內設置等距離觀測點;獲取至少一個用戶特征在當前觀測點的值;判斷當前觀測值與前一觀測值的差值是否滿足預設條件;滿足預設條件時,當前觀測點的值即為拐點值。
根據本發明的一種優選實施方式,所述拐點值基于至少一個用戶特征進行大數據分析得到。具體為存儲至少一個用戶特征的拐點出現時刻的特征值變化的經驗值;按照預定周期獲取至少一個用戶特征的值;并與拐點出現時刻的特征值的經驗值進行比較,判斷所述當前時刻是否達到拐點。
根據本發明的一種優選實施方式,所述用戶特征包括以下數據的至少一種:逾期率、欠款金額、欠款時長、逾期還款金額、逾期還款時長。
根據本發明的一種優選實施方式,第一屬性值為1,代表好客戶;第二屬性值為0,代表壞客戶。
本發明的第二方面提出一種基于用戶特征拐點值的訓練樣本生成裝置,包括:獲取模塊,獲取用戶樣本并提取至少一個用戶特征;確定模塊,根據至少一個用戶特征的拐點值進行判斷,以確定用戶樣本屬性,所述屬性包括第一值和第二值;訓練模塊,根據所述確定屬性的用戶樣本進行模型訓練。
根據本發明的一種優選實施方式,所述裝置還包括判斷模塊,用于在至少一個用戶特征出現拐點值的時間點進行樣本屬性判斷。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京淇瑀信息科技有限公司,未經北京淇瑀信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910330919.X/2.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





