[發明專利]一種應用邏輯回歸建模的市民信用積分評估方法在審
| 申請號: | 202010568798.5 | 申請日: | 2020-06-19 |
| 公開(公告)號: | CN111724175A | 公開(公告)日: | 2020-09-29 |
| 發明(設計)人: | 吳福全;朱全日;張小花;左楊;劉爽 | 申請(專利權)人: | 安徽迪科數金科技有限公司 |
| 主分類號: | G06Q30/00 | 分類號: | G06Q30/00;G06Q30/06;G06Q40/02;G06N20/00 |
| 代理公司: | 合肥正則元起專利代理事務所(普通合伙) 34160 | 代理人: | 韓立峰 |
| 地址: | 230088 安徽省合肥市高*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 應用 邏輯 回歸 建模 市民 信用 積分 評估 方法 | ||
本發明公開了一種應用邏輯回歸建模的市民信用積分評估方法,該方法具體包括下述步驟:首先獲取到自變量數據,自變量數據包括:政務數據和銀行數據;政務數據包括:身份特征、消費能力、信用歷史、資質榮譽;銀行數據包括資產信息,資產信息包括年收入、是否有自有住宅;之后獲取到應變量數據y,具體包括好客戶和壞客戶,逾期超過60天的客戶為壞客戶、未逾期的為好客戶;本發明通過聯邦學習可以增加可用數據的總量,能很好的解決現存數據孤島的問題;對企業自身而言,使用聯邦學習能簡單、合法且低成本的獲取外部有效的數據信息,快速解決某些因數據量或數據維度不足而導致的困擾,而且也不會造成合作企業間數據或商業機密的泄露。
技術領域
本發明屬于市民信用積分領域,具體是涉及一種應用邏輯回歸建模的市民信用積分評估方法。
背景技術
數據隱私保護是通過聯邦學習來實現的,其中聯邦學習的設計目標是在保障大數據交換時的信息安全、保護終端數據和個人數據隱私、保證合法合規的前提下,在多參與方或多計算結點之間開展高效率的機器學習。
聯邦學習分為橫向聯邦學習和縱向聯邦學習,本文用到的是縱向聯邦學習。縱向聯邦學習適用于兩個數據集共享相同的樣本ID空間但特征空間不同的情況。縱向聯邦學習是聚合這些不同特征并以保護隱私的方式計算訓練損失和梯度的過程,以利用雙方的數據共同構建模型。
發明內容
本發明的目的在于提供一種應用邏輯回歸建模的市民信用積分評估方法。
本發明的目的可以通過以下技術方案實現:
一種應用邏輯回歸建模的市民信用積分評估方法,該方法具體包括下述步驟:
步驟一:獲取到自變量數據,自變量數據包括:政務數據和銀行數據;
其中,政務數據包括:身份特征、消費能力、信用歷史、資質榮譽;
其中,銀行數據包括資產信息,資產信息包括年收入、是否有自有住宅;
步驟二:獲取到應變量數據y,具體包括好客戶和壞客戶,逾期超過60天的客戶為壞客戶、未逾期的為好客戶;
步驟三:設銀行側稱為guest,政務側稱為host,其中政務側包括若干個host,具體包括政務網、社保局、公積金中心;并且在政務側搭建一個第三方稱為arbiter;
步驟四:進行數據分析,具體為:
步驟1):首先對guest和host兩方樣本id取交集,找到相同的用戶,用這一批用戶作為建模樣本;
步驟2):補缺,填充缺失值,guest和host分別在本地進行;
步驟3):分箱及計算每個特征的woe和IV值;
S3.1:分箱采用等頻分箱,具體為:將每個變量所有的特征值劃分到n個箱子中,使得每個箱子的量相等,從而得到每個箱子的分割點;
S3.2:guest和host分別在本地對各自所有的連續型變量進行等頻分箱;
S3.3:guest對y進行Paillier加密,并且將加密后的y發送給host;
S3.4:guest計算本地的IV值:計算所有特征分箱后各個組別的好、壞樣本數,比如得到如下格式:result_sum={'x1':[[0,0],[2,1],[0,0],[1,0]],'x2':[[0,0],[0,0],[0,0],[0,0],[1,0],[2,1]],'x3':[[0,0],[0,0],[2,1],[1,0]]},接著計算每個特征每個箱子的woe值,公式如下:
woe_i=ln(壞樣本率/好樣本率);
iv_i=(壞樣本率-好樣本率)*woe_i;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于安徽迪科數金科技有限公司,未經安徽迪科數金科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010568798.5/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種自發電聯網式預設定加注槍
- 下一篇:一種音頻輸出設備的選擇方法及顯示設備





