[發明專利]一種應用于金融場景的隱私特征IV值計算方法在審
| 申請號: | 202211293775.3 | 申請日: | 2022-10-21 |
| 公開(公告)號: | CN115600244A | 公開(公告)日: | 2023-01-13 |
| 發明(設計)人: | 李維成;袁文俊;李升林 | 申請(專利權)人: | 上海陣方科技有限公司 |
| 主分類號: | G06F21/62 | 分類號: | G06F21/62;G06F21/60 |
| 代理公司: | 南昌金軒知識產權代理有限公司 36129 | 代理人: | 陳梅 |
| 地址: | 200232 上海市*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 應用于 金融 場景 隱私 特征 iv 計算方法 | ||
本發明涉及隱私計算技術領域,具體公開了一種應用于金融場景的隱私特征IV值計算方法,包括如下步驟:步驟S1,首先參與計算的雙方生成一組公私鑰對,其中,參與雙方分別以即第一參與方和第二參與方表示;步驟S2,將第一參與方的公鑰公開給第二參與方;步驟S3,第一參與方利用自己的公鑰加密各個樣本數據的標簽值生成各個樣本數據的密文標簽值,并將樣本數據的密文標簽值發送給第二參與方;步驟S4,同時針對某一特征,第二參與方基于特征值對多個樣本數據進行分組等步驟。本發明底層基于密碼學的安全多方計算框架,安全性可驗;同時本發明對金融場景下隱私計算的各種隱私計算方法如邏輯預測、邏輯回歸提供了很好的基礎設施。
技術領域
本發明涉及隱私計算技術領域,具體是一種應用于金融場景的隱私特征IV值計算方法。
背景技術
隨著機器學習、聯邦學習等新興技術的不斷崛起和發展,傳統金融行業也開始逐步接觸和探索機器學習的一些常用算法和模型。其中特征IV值(Inform第一參與方tion V第一參與方lue)是機器學習二分類問題中一個比較重要的指標,其主要用來對輸入變量進行編碼和預測能力的評估。特征變量IV值的大小即表示該變量預測能力的強弱。雖然目前市面上已經有了一些與之相關的一些算法和說明,但這些算法很難直接拿過來用于一些隱私計算的系統或方法上,故在金融場景中落地的難度更是可想而知。
傳統機器學習算法中,特征變量越多越大時,需要計算特征IV進行篩選,IV值越高,表示特征蘊含信息量越大,越適合于機器學習算法的模型訓練。而隨著數據隱私及安全保護的日重要性日益提升,基于明文數據計算IV值的方法已經難以滿足隱私保護要求,當然使用MPC技術可解決當前的隱私安全的問題,但同時MPC技術對通信寬帶要求較高,當數據量很大時,計算成本及時間成本也非常的高,故用這些技術的算法和系統很難在金融場景下落地。
綜上所述本發明提出一種應用于金融場景的隱私特征IV值計算方法。
發明內容
本發明的主要基于部分金融場景的業務和需求特點,提出了一種應用于金融場景的隱私特征IV值計算方法;我們在用邏輯回歸、決策樹等模型方法構建分類模型時,經常需要對自變量進行篩選,挑選入模變量過程是個比較復雜的過程,需要考慮很多因素,比如變量之間的相關性、變量的預測能力、變量在業務上的可解釋性等,其中最主要和直接的衡量標準就是變量的預測能力;隱私IV特征值就是用來解決這個問題的存在,他可以用來衡量自變量的預測能力,從而為我們提供更準確的入模變量。
為實現上述目的,本發明提供如下技術方案:一種應用于金融場景的隱私特征IV值計算方法,包括如下步驟:
步驟S1,首先參與計算的雙方生成一組公私鑰對,其中,參與雙方分別以即第一參與方和第二參與方表示;
步驟S2,將第一參與方的公鑰公開給第二參與方;
步驟S3,第一參與方利用自己的公鑰加密各個樣本數據的標簽值生成各個樣本數據的密文標簽值,并將樣本數據的密文標簽值發送給第二參與方;
步驟S4,同時針對某一特征,第二參與方基于特征值對多個樣本數據進行分組,并結合各個樣本數據的密文標簽值以及第一參與方的公鑰計算每個分組的密文WOE值;
步驟S5,第二參與方將各分組的密文WOE值進行累加,得到該特征的最終密文WOE值;
步驟S6,通過各分組的密文WOE值計算出各個分組的密文特征IV值;
步驟S7,第二參與方將計算后的最終密文特征IV值加密后發送給第一參與方;
步驟S8,第一參與方利用自己的私鑰解密該特征的最終密文特征IV值,得到該特征的明文特征IV值,并將其發送給第二參與方;
步驟S9,第二參與方得到該特征的最終IV值后繼續在系統中進行特征工程或者邏輯預測的工程構建。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海陣方科技有限公司,未經上海陣方科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211293775.3/2.html,轉載請聲明來源鉆瓜專利網。





