[發(fā)明專利]基于客戶端分類聚合的聯(lián)合風險評估方法及相關設備有效
| 申請?zhí)枺?/td> | 202011327614.2 | 申請日: | 2020-11-24 |
| 公開(公告)號: | CN112465626B | 公開(公告)日: | 2023-08-29 |
| 發(fā)明(設計)人: | 李澤遠;王健宗 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06Q40/02 | 分類號: | G06Q40/02;G06F18/23;G06F18/214 |
| 代理公司: | 深圳市精英專利事務所 44242 | 代理人: | 武志峰 |
| 地址: | 518000 廣東省深圳市福田區(qū)福*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 客戶端 分類 聚合 聯(lián)合 風險 評估 方法 相關 設備 | ||
本發(fā)明公開了基于客戶端分類聚合的聯(lián)合風險評估方法及相關設備,涉及人工智能技術領域,可應用于銀行風險評估系統(tǒng)中,方法包括:服務器端對客戶端進行聚類,確定s個最終聚類中心點;最終聚類中心點從服務器端讀取初始模型,并下發(fā)至聚類的客戶端;客戶端基于本地數據集對所述初始模型進行訓練得到初始模型參數,并將所述初始模型參數發(fā)送至最終聚類中心點;最終聚類中心點對各所述客戶端的初始模型參數進行聚合,得到中間模型參數并上傳;服務器端對各聚類的所述中間模型參數進行聚合得到最終模型參數,并進行更新,得到用于信用風險評估的全局模型。本發(fā)明在同一類的客戶端中執(zhí)行聯(lián)邦學習的訓練所達到的效果更好,最終模型預測準確率更高。
技術領域
本發(fā)明涉及人工智能技術領域,特別涉及基于客戶端分類聚合的聯(lián)合風險評估方法及相關設備。
背景技術
銀行的主要業(yè)務是借貸,為了降低貸款的信用風險,銀行可以對借款人進行信用檢查,而信用風險評估就是一種用于計算個人、企業(yè)或組織的信用度的方法。它可以幫助銀行評估貸款申請人是否會違約以及違約的概率。在傳統(tǒng)方法中,銀行金融機構主要基于各種借貸數額和相關主觀因素來評估信用風險等級,這種方法是反應性的而不是預測性的,模型效果也不理想。因此,需要進一步開發(fā)一些較為準確的定量預測模型,而機器學習模型,作為從以往海量數據中獲得分析和見解的工具,被認為可以在風險評估中發(fā)揮很好的作用。
但是,諸如神經網絡之類的機器學習模型需要一個訓練中心使用大量的數據對模型進行訓練,數據的種類特征越完善,訓練的模型效果越好、越能進行準確的信譽評價。然而,一種常見的現(xiàn)象是,一個貸款風險極高的人,在A銀行信譽極差無法通過貸款審核,但是在B銀行的信譽表現(xiàn)不錯,由于銀行之間的數據不互通,此人在B銀行獲得貸款,造成了B銀行的損失。因此,為了避免單個銀行數據表現(xiàn)不完整帶來的風險誤判,同時聯(lián)合使用多家銀行的數據是必要的。可是,對于銀行來說,出于金融監(jiān)管和用戶敏感數據隱私保護的考慮,當地分行的數據并不能離開本地,要求各家銀行互相分享數據、將所有數據發(fā)送到一個中心服務器并對其應用機器學習算法訓練是不可能也不現(xiàn)實的。這導致了一家家銀行成為了一個個的“數據孤島”。
聯(lián)邦學習是一種全新的分布式機器學習框架,旨在滿足多方用戶隱私保護、數據安全和政府法規(guī)的要求的同時,進行數據協(xié)作和機器學習建模,解決“數據孤島”的問題。
但是,聯(lián)邦學習技術在應用的過程中面臨著統(tǒng)計方面的挑戰(zhàn)。機器學習與深度學習模型的迭代優(yōu)化依賴于隨機梯度下降算法(SGD),但是為了保證SGD算法中取到的隨機梯度是完整梯度的無偏估計,訓練數據應該滿足獨立同分布的假設。聯(lián)邦學習現(xiàn)在廣泛使用的聚合優(yōu)化算法FedAvg也是基于數據獨立同分布的假設,并在參數聚合時加以簡單平均。已有研究證明,如果使用高度傾斜的非獨立同分布數據進行訓練,使用現(xiàn)有的迭代優(yōu)化算法FedAvg,得到的神經網絡模型準確率有顯著的降低,降低的準確率甚至可達50%以上。
由于在實踐中,要求每個參與方的本地數據滿足獨立同分布的性質是不現(xiàn)實的,因此有必要對聯(lián)邦學習的訓練過程和參數聚合方法加以改進,盡可能減少各參與訓練的客戶端的數據異質性給訓練的模型帶來的影響。
發(fā)明內容
本發(fā)明的目的是提供基于客戶端分類聚合的聯(lián)合風險評估方法及相關設備,旨在解決現(xiàn)有應用聯(lián)邦學習的風險評估方法預測準確率較低的問題。
第一方面,本發(fā)明實施例提供一種基于客戶端分類聚合的聯(lián)合風險評估方法,其中,包括:
服務器端從多個客戶端中隨機選擇s個作為初始聚類中心點,計算每一個所述初始聚類中心點的本地數據集的數據集質心;
所述服務器端根據每一所述客戶端的本地數據集的數據集質心與所述初始聚類中心點的數據集質心之間的距離對各個所述客戶端進行聚類,并對聚類結果進行迭代更新確定s個最終聚類中心點以及各聚類下的客戶端;
所述最終聚類中心點從服務器端讀取用于信用風險評估的初始模型,并將讀取的初始模型下發(fā)至對應聚類的客戶端;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011327614.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種智能防疫系統(tǒng)
- 下一篇:一種便攜式藥物振蕩器
- 同類專利
- 專利分類





