[發(fā)明專利]一種基于隱私保護(hù)的評(píng)分卡建模方法及裝置在審
| 申請(qǐng)?zhí)枺?/td> | 202111435950.3 | 申請(qǐng)日: | 2021-11-29 |
| 公開(kāi)(公告)號(hào): | CN114139450A | 公開(kāi)(公告)日: | 2022-03-04 |
| 發(fā)明(設(shè)計(jì))人: | 李雪峰;梁亮 | 申請(qǐng)(專利權(quán))人: | 百保(上海)科技有限公司 |
| 主分類號(hào): | G06F30/27 | 分類號(hào): | G06F30/27;G06N20/00;H04L9/00 |
| 代理公司: | 蘇州京昀知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 32570 | 代理人: | 顧友 |
| 地址: | 200433 上海市*** | 國(guó)省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 隱私 保護(hù) 評(píng)分 建模 方法 裝置 | ||
本發(fā)明公開(kāi)了一種基于隱私保護(hù)的評(píng)分卡建模方法及裝置,方法包括:業(yè)務(wù)方與各個(gè)服務(wù)方分別進(jìn)行用戶樣本對(duì)齊,確定用于建模的目標(biāo)數(shù)據(jù),所述業(yè)務(wù)方和各個(gè)所述服務(wù)方根據(jù)標(biāo)簽數(shù)據(jù)以及各自擁有的目標(biāo)數(shù)據(jù)的分箱結(jié)果計(jì)算得到各自基于差分隱私的WOE值,所述標(biāo)簽數(shù)據(jù)為所述業(yè)務(wù)方擁有,所述業(yè)務(wù)方以及各個(gè)所述服務(wù)方將各自計(jì)算得到的WOE值作為分類模型的輸入進(jìn)行聯(lián)邦建模,獲取各自的目標(biāo)模型,通過(guò)采用基于差分隱私的聯(lián)邦WOE計(jì)算方式,可以保證即使分箱中標(biāo)簽僅有一種取值的情況下,服務(wù)方也不會(huì)猜測(cè)出標(biāo)簽信息,避免標(biāo)簽信息泄露。
技術(shù)領(lǐng)域
本發(fā)明涉及信息處理技術(shù)領(lǐng)域,特別是涉及一種基于隱私保護(hù)的評(píng)分卡建模方法及裝置。
背景技術(shù)
隨著金融行業(yè)對(duì)風(fēng)控業(yè)務(wù)要求的提高,高準(zhǔn)確率的風(fēng)控準(zhǔn)入模型可有效降低逾期率。然而,信息化時(shí)代用戶的行為數(shù)據(jù)通常會(huì)分散在各個(gè)企業(yè)(如運(yùn)營(yíng)商、互聯(lián)網(wǎng)、金融機(jī)構(gòu)等)中。單一企業(yè)中所涵蓋的用戶金融行為特征有限。雖然可以通過(guò)聯(lián)合多個(gè)企業(yè)的數(shù)據(jù)共同構(gòu)建模型來(lái)提高模型的準(zhǔn)確率,然而,各企業(yè)的用戶數(shù)據(jù)可能涉及到大量個(gè)人敏感和隱私數(shù)據(jù),國(guó)家法律法規(guī)對(duì)個(gè)人隱私保護(hù)的條例也越來(lái)越嚴(yán)格,因此傳統(tǒng)的將數(shù)據(jù)集中起來(lái)建模的方式不再可行。在此背景下,聯(lián)邦學(xué)習(xí)的方式,為在保護(hù)數(shù)據(jù)隱私的前提下、安全共建模型提供了新的解決思路。
聯(lián)邦學(xué)習(xí)的應(yīng)用場(chǎng)景很多,聯(lián)邦風(fēng)控評(píng)分卡建模就是常見(jiàn)的一種。常用的評(píng)分卡建模方式有:邏輯回歸(Logistic Regression,以下簡(jiǎn)稱LR)、XGBoost(以下簡(jiǎn)稱XGB)。在評(píng)分卡場(chǎng)景中,為了進(jìn)行特征篩選和保證模型的穩(wěn)定性,引入了WOE值的概念。即,建模數(shù)據(jù)在進(jìn)入評(píng)分卡建模之前,需要進(jìn)行WOE值的轉(zhuǎn)換,這是也是評(píng)分卡模型中常用的技術(shù)手段。然而,現(xiàn)有的聯(lián)邦評(píng)分卡建模方式,在計(jì)算WOE時(shí)存在當(dāng)分箱中只有正樣本或者負(fù)樣本時(shí),服務(wù)方可以通過(guò)WOE值獲取一部分標(biāo)簽信息,導(dǎo)致業(yè)務(wù)方擁有的標(biāo)簽泄露等問(wèn)題。
因此,亟需提出一種新的評(píng)分卡建模方法,以解決上述問(wèn)題。
發(fā)明內(nèi)容
為了解決現(xiàn)有技術(shù)的問(wèn)題,本發(fā)明提供了一種基于隱私保護(hù)的評(píng)分卡建模方法及裝置,采用基于差分隱私的聯(lián)邦WOE計(jì)算方式,以保證即使分箱中標(biāo)簽僅有一種取值的情況下,服務(wù)方也不會(huì)猜測(cè)出標(biāo)簽信息。
為解決上述一個(gè)或多個(gè)技術(shù)問(wèn)題,本申請(qǐng)采用的技術(shù)方案是:
第一方面,提供了一種基于隱私保護(hù)的評(píng)分卡建模方法,所述方法包括:
業(yè)務(wù)方與各個(gè)服務(wù)方分別進(jìn)行用戶樣本對(duì)齊,確定用于建模的目標(biāo)數(shù)據(jù);
所述業(yè)務(wù)方和各個(gè)所述服務(wù)方根據(jù)標(biāo)簽數(shù)據(jù)以及各自擁有的目標(biāo)數(shù)據(jù)的分箱結(jié)果計(jì)算得到各自基于差分隱私的WOE值,所述標(biāo)簽數(shù)據(jù)為所述業(yè)務(wù)方擁有;
所述業(yè)務(wù)方以及各個(gè)所述服務(wù)方將各自計(jì)算得到的WOE值作為分類模型的輸入進(jìn)行聯(lián)邦建模,獲取各自的目標(biāo)模型。
進(jìn)一步的,所述業(yè)務(wù)方與各個(gè)服務(wù)方分別進(jìn)行用戶樣本對(duì)齊,確定用于建模的目標(biāo)數(shù)據(jù)包括:
業(yè)務(wù)方向各個(gè)服務(wù)方發(fā)送聯(lián)邦建模請(qǐng)求,所述聯(lián)邦建模請(qǐng)求中包括預(yù)設(shè)維度;
所述業(yè)務(wù)方與各個(gè)所述服務(wù)方分別根據(jù)所述預(yù)設(shè)維度進(jìn)行用戶樣本對(duì)齊,確定用于建模的目標(biāo)數(shù)據(jù)。
進(jìn)一步的,所述目標(biāo)數(shù)據(jù)包括所述業(yè)務(wù)方擁有的第一特征數(shù)據(jù),所述業(yè)務(wù)方和各個(gè)所述服務(wù)方根據(jù)標(biāo)簽數(shù)據(jù)以及各自擁有的目標(biāo)數(shù)據(jù)的分箱結(jié)果計(jì)算得到各自基于差分隱私的WOE值包括:
所述業(yè)務(wù)方根據(jù)標(biāo)簽數(shù)據(jù)以及自己擁有的第一特征數(shù)據(jù)的分箱結(jié)果計(jì)算得到所有第一特征對(duì)應(yīng)的WOE值。
進(jìn)一步的,所述目標(biāo)數(shù)據(jù)包括所述服務(wù)方擁有的第二特征數(shù)據(jù),所述業(yè)務(wù)方和各個(gè)所述服務(wù)方根據(jù)標(biāo)簽數(shù)據(jù)以及各自擁有的目標(biāo)數(shù)據(jù)的分箱結(jié)果計(jì)算得到各自基于差分隱私的WOE值包括:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于百保(上海)科技有限公司,未經(jīng)百保(上海)科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111435950.3/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 一種授權(quán)管理系統(tǒng)和方法及授權(quán)管理服務(wù)器
- 一種授權(quán)管理系統(tǒng)和方法及授權(quán)管理服務(wù)器
- 用于生成隱私簡(jiǎn)檔的方法和設(shè)備
- 手機(jī)隱私保護(hù)系統(tǒng)
- 密碼設(shè)置方法及裝置
- 移動(dòng)終端和移動(dòng)終端的隱私保護(hù)方法
- 一種隱私信息保護(hù)方法、裝置及系統(tǒng)
- 一種隱私信息管理方法、裝置和系統(tǒng)
- 圖片隱私的預(yù)測(cè)方法及裝置、存儲(chǔ)介質(zhì)及電子設(shè)備
- 一種基于區(qū)塊鏈的隱私安全管理系統(tǒng)
- 供應(yīng)商評(píng)分系統(tǒng)及方法
- 用戶評(píng)分實(shí)現(xiàn)方法、用戶評(píng)分客戶端和電子設(shè)備
- 一種評(píng)分信息處理方法及裝置
- 一種評(píng)分統(tǒng)一方法、裝置及存儲(chǔ)介質(zhì)
- 基于風(fēng)險(xiǎn)的資產(chǎn)評(píng)分方法和系統(tǒng)
- 一種交易評(píng)價(jià)的方法、裝置及終端
- 評(píng)分方法、裝置及移動(dòng)終端、服務(wù)器、存儲(chǔ)介質(zhì)
- 檢驗(yàn)節(jié)目評(píng)分有效性的方法及設(shè)備
- 疼痛評(píng)分尺
- 便攜式MEWS評(píng)分參照盤





