[發明專利]一種基于FWA_DBN的客戶信用評估方法及系統在審
| 申請號: | 202011351682.2 | 申請日: | 2020-11-27 |
| 公開(公告)號: | CN112529684A | 公開(公告)日: | 2021-03-19 |
| 發明(設計)人: | 江遠強 | 申請(專利權)人: | 百維金科(上海)信息科技有限公司 |
| 主分類號: | G06Q40/02 | 分類號: | G06Q40/02;G06K9/62;G06N3/04 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 201913 上海市崇明區長興鎮潘園公*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 fwa_dbn 客戶 信用 評估 方法 系統 | ||
1.一種基于FWA_DBN的客戶信用評估方法及系統,其特征在于:包括步驟:
S1.對已有貸款表現的客戶抽樣作為建模樣本,并采集客戶的信用特征數據;
S2.對所獲取建模數據進行數據預處理,采用min-max方法對預處理后的數據歸一化處理,按照預設比例劃分訓練集和測試集;
S3.根據訓練數據特征初步確定DBN的結構,初始化DBN的相關參數,包括:輸入節點、輸出節點、最大層數、每層的節點數和最大迭代次數;
S4.利用訓練集對DBN進行訓練,并使用FWA算法對網絡模型參數進行優化,得到FWA-DBN預測模型;
S5.將驗證集導入到FWA-DBN進行測試,如果測試精度不滿足預設閾值要求,則重復步驟S3以及步驟S4再次訓練FWA-DBN預測模型;
S6.將FWA-DBN的客戶信用評估模型部署至貸款申請平臺輸出實時申請信用評分,實現申請客戶的實時審批,并定期將有表現數據輸入到模型訓練,實現模型的在線更新。
2.根據權利要求1所述的一種基于FWA_DBN的客戶信用評估方法及系統,其特征在于:在S1中,對已有貸款表現的客戶抽樣作為建模樣本,并采集客戶的信用特征數據,信用特征數據包括個人基本信息、操作行為埋點數據以及第三方數據。
3.根據權利要求1所述的一種基于FWA_DBN的客戶信用評估方法及系統,其特征在于:在S2中,對于缺失的數據,通過采用插值法,插入中位數補全,令數據樣本保持一致;原變量因量綱不同和數值差異太大回對DBN的訓練帶來的影響,需要對原始數據進行歸一化處理,本專利使用的歸一化函數公式如下:
其中,ymax默認為1,ymin默認為-1,x為當前要處理的原始數據項,xmax為所有要處理的原始數據項中的最大值,xmin為所有要處理的原始數據項中的最小值。
對歸一化后的數據集根據申請時間按照比例7:3切分為訓練集和測試集。
4.如權利要求1所述的一種基于FWA_DBN的客戶信用評估方法及系統,S3中,在根據所述根據訓練集構建DBN模型,初始化神經網絡參數。
深度置信網絡是一個概率生成模型,由多個受限波爾茲曼機(RestrictedBoltzmannMachine,RBM)依次疊加而成,深度置信網絡的最底層接收輸入數據向量,并通過RBM轉換輸入數據到隱藏層,即高一層RBM的輸入來自低一層RBM的輸出。
步驟3-1:建立能量函數
RBM是一種可視層和隱藏層組成的雙向遞歸神經網絡,可視層是由一層代表輸入的顯層單元V用于接收輸入,隱藏層是由一層代表隱藏變量的隱藏單元h用于提取特征。RBM的可視層單元為v={v1,v2,v3,…,vI}∈{0,1},隱藏層單元為h={h1,h2,h3,…,hI}∈{0,1},權重矩陣為w,可視層單元的閾值為a和隱藏層單元的閾值為b,則所有可視單元和隱藏層單元聯合狀態(v,h)的能量函數為:
其中,wij為第i個可視層和第j個隱藏單元的連接權重,vi、hj分別為可視層單元i和隱藏層單元j的隱藏層向量,ci、bj分別為可視層單元i和隱藏層單元j的閾值,I為可視層單元的數量,J為隱藏層單元的數量。
步驟3-2:聯合概率分布
根據上式得到的能量函數E(v,h)得到可視層和隱藏層之間的聯合概率分布為:
其中,Z是一個模擬物理系統的標準化常數,由所有可視層單元和隱藏層單元之間的能量值相加得到。
步驟3-3:獨立分布
通過聯合概率分布,得到可視層向量v的獨立分布為:
則在給定一個隨機輸入可視層向量v的條件下,隱藏層向量h的概率:
在給定一個隨機輸入隱藏層向量h的條件下,可視層向量v的概率:
由于RBM的結構單元是一個二值狀態,記一邏輯函數sigmoid激活函數為
步驟3-4:激活概率
由RBM的結構和狀態概率可知,當給定各可視層單元的狀態時,隱藏層各個單元的狀態是相互獨立的;同理當給定各隱藏層單元的狀態時,可視層各個單元的狀態也是相互獨立的;可視層v和隱藏層h的激活概率分別為:
步驟3-5:梯度下降法調優權值和閾值
采用梯度下降法求解出實際值與期望值之間誤差值:
其中,E(t)為迭代t次的誤差,z(t),y(t)分別是迭代t次的期望輸出值和實際輸出值。
再根據誤差求出對權值的梯度,沿著梯度下降的方向進行調優:
其中,μ為學習率,E(t)為迭代t次的誤差,Wij(t+1)、bj(t+1)分別為調優后權值和閾值。
當所有RBM網絡結構完成訓練時,多個RBM網絡結構被堆疊為深度信念網絡。
所述S3中,建立DBN分類網絡模型,分別使用無標簽的預訓練數據樣本進行網絡預訓練,以及有標簽的樣本進行參數微調,具體步驟為:
(1)輸入歸一化的預訓練樣本數據,設置網絡結構參數,隨機初始化網絡層間權值,每層閾值值初始置零;
(2)使用預訓練樣本數據逐層訓練RBM層,每一層RBM層的輸出作為下一層的輸入,直到訓練完畢,得到各層網絡權值和閾值;
(3)使用(2)訓練所得到的網絡參數作為初始值,并使用帶標簽的數據樣本,將DBN展開成BP網絡結構,網絡的最高層還需加一層分類層,作為對網絡特征輸出的最終分類判斷層,將得到的結果與所輸入的帶標簽數據的標簽進行對比,得到的誤差數據用來進行誤差的反向傳播,微調整個網絡的參數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于百維金科(上海)信息科技有限公司,未經百維金科(上海)信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011351682.2/1.html,轉載請聲明來源鉆瓜專利網。





