[發(fā)明專利]評分卡模型訓練方法、裝置、存儲介質(zhì)及電子裝置在審
| 申請?zhí)枺?/td> | 202011296435.7 | 申請日: | 2020-11-18 |
| 公開(公告)號: | CN112330048A | 公開(公告)日: | 2021-02-05 |
| 發(fā)明(設計)人: | 胡振禹;史晨陽;王青林;王磊;卜廣慶;王瑜;韓海英;郭皓;鄒華;程一鳴;詹俊杰;田江;李琨;額日和 | 申請(專利權(quán))人: | 中國光大銀行股份有限公司;光大科技有限公司 |
| 主分類號: | G06Q10/04 | 分類號: | G06Q10/04;G06Q10/06;G06N20/00 |
| 代理公司: | 北京康信知識產(chǎn)權(quán)代理有限責任公司 11240 | 代理人: | 劉旺貴 |
| 地址: | 100033 北京市*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 評分 模型 訓練 方法 裝置 存儲 介質(zhì) 電子 | ||
本發(fā)明實施例提供了一種評分卡模型訓練方法、裝置、存儲介質(zhì)及電子裝置,該方法包括:將數(shù)據(jù)寬表中的連續(xù)變量進行分箱得到離散的變量;將該變量輸入帶約束的邏輯回歸模型中,將該邏輯回歸模型轉(zhuǎn)換為評分卡模型,并計算該評分卡模型的補償和刻度,其中,該邏輯回歸模型的約束條件是限制該變量系數(shù)的下界為非負。通過本發(fā)明,由于限制邏輯回歸模型中變量系數(shù)的下界為非負,解決了相關技術中評分卡模型在使用邏輯回歸算法訓練模型時自變量間存在多重共線的關系而導致個別變量系數(shù)為負,進而導致模型失去原有的解釋力的問題,進而達到了避免多次模型迭代、減少模型訓練的時間成本和訓練開銷的效果。
技術領域
本發(fā)明實施例涉及信息交互技術領域,具體而言,涉及一種評分卡模型訓練方法、裝置、存儲介質(zhì)及電子裝置。
背景技術
評分卡模型是在具體場景中以分數(shù)衡量風險幾率的一種方法,通常在信用貸款的風控業(yè)務中廣泛使用,建模原理為將模型自變量通過證據(jù)權(quán)重(Weight Of Evidence,WOE)編碼方式離散化之后,運用邏輯回歸算法對二分類問題進行建模,擬合出變量對應的系數(shù)。
聯(lián)邦機器學習是一種新興的人工智能基礎技術,能有效幫助多個機構(gòu)在滿足用戶隱私保護、數(shù)據(jù)安全及合規(guī)的要求下,進行數(shù)據(jù)使用和機器學習建模。
傳統(tǒng)邏輯回歸模型系數(shù)的值可正可負,當值為負數(shù)時,該變量的趨勢與單變量分析時的趨勢相反,模型為線性模型,當?shù)玫侥P偷南禂?shù)后,將邏輯回歸模型預測的概率根據(jù)設定的分值刻度轉(zhuǎn)化為分數(shù)。在傳統(tǒng)邏輯回歸模型下,系數(shù)出現(xiàn)負值時,一般認為模型不具有可解釋性,需要重現(xiàn)選擇變量并建模,直到模型具有可解釋性為止。
相關的評分卡模型在用邏輯回歸算法訓練模型時,并不能保證擬合出的系數(shù)均為非負,由于自變量間存在多重共線的關系,很可能導致個別變量系數(shù)為負,導致模型失去了原有的解釋性。
針對相關技術中評分卡模型在使用邏輯回歸算法訓練模型時自變量間存在多重共線的關系而導致個別變量系數(shù)為負,進而導致模型失去原有的解釋力的問題,目前尚未提出有效的解決方案。
發(fā)明內(nèi)容
本發(fā)明實施例提供了一種評分卡模型訓練方法、裝置、存儲介質(zhì)及電子裝置,以至少解決相關技術中評分卡模型在使用邏輯回歸算法訓練模型時自變量間存在多重共線的關系而導致個別變量系數(shù)為負,進而導致模型失去原有的解釋力的問題。
根據(jù)本發(fā)明的一個實施例,提供了一種評分卡模型訓練方法,包括:將數(shù)據(jù)寬表中的連續(xù)變量進行分箱得到離散的變量;將所述變量輸入帶約束的邏輯回歸模型中,將所述邏輯回歸模型轉(zhuǎn)換為評分卡模型,并計算所述評分卡模型的補償和刻度,其中,所述邏輯回歸模型的約束條件是限制所述變量系數(shù)的下界為非負。
在一個示例性實施例中,將所述變量輸入帶約束的邏輯回歸模型中,將所述邏輯回歸模型轉(zhuǎn)換為評分卡模型,并計算所述評分卡模型的補償和刻度,可以包括:第一數(shù)據(jù)機構(gòu)和第二數(shù)據(jù)機構(gòu)進行信息交互,根據(jù)帶約束的所述邏輯回歸模型確定第一數(shù)據(jù)寬表中變量的第一模型權(quán)值和第二數(shù)據(jù)寬表中變量的第二模型權(quán)值,其中,所述邏輯回歸模型的約束條件是限制所述變量系數(shù)的下界為非負;所述第一數(shù)據(jù)機構(gòu)和所述第二數(shù)據(jù)機構(gòu)分別將根據(jù)所述第一模型權(quán)值計算出的第一梯度值、所述第二模型權(quán)值計算出的第二梯度值和損失發(fā)送至第三方機構(gòu);所述第三方機構(gòu)根據(jù)所述第一梯度值、第二梯度值和損失更新所述第一模型權(quán)值和所述第二模型權(quán)值,并將經(jīng)過更新后滿足停止條件的所述第一模型權(quán)值和經(jīng)過更新后滿足停止條件的所述第二模型權(quán)值分別發(fā)送至所述第一數(shù)據(jù)機構(gòu)和所述第二數(shù)據(jù)機構(gòu);所述第一數(shù)據(jù)機構(gòu)和所述第二數(shù)據(jù)機構(gòu)分別根據(jù)經(jīng)過更新后滿足停止條件的所述第一模型權(quán)值和經(jīng)過更新后滿足停止條件的所述第二模型權(quán)值計算得出第一評分卡模型的補償和刻度以及第二評分卡模型的補償和刻度。
在一個示例性實施例中,在第一數(shù)據(jù)機構(gòu)和第二數(shù)據(jù)機構(gòu)進行信息交互之前,還可以包括:所述第一數(shù)據(jù)機構(gòu)和所述第二數(shù)據(jù)機構(gòu)接收所述第三方機構(gòu)發(fā)送的公鑰。
該專利技術資料僅供研究查看技術是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國光大銀行股份有限公司;光大科技有限公司,未經(jīng)中國光大銀行股份有限公司;光大科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011296435.7/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預測目的的數(shù)據(jù)處理系統(tǒng)或方法;其他類目不包含的專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預測目的的處理系統(tǒng)或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優(yōu)化,例如線性規(guī)劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規(guī)劃、調(diào)度或分配時間、人員或機器資源;企業(yè)規(guī)劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





