[發(fā)明專利]一種用于聯(lián)邦學習的圖形化模型全生命周期建模方法有效
| 申請?zhí)枺?/td> | 201911134600.6 | 申請日: | 2019-11-19 |
| 公開(公告)號: | CN111104731B | 公開(公告)日: | 2023-09-15 |
| 發(fā)明(設計)人: | 崔晶晶;許泱洋 | 申請(專利權)人: | 北京集奧聚合科技有限公司 |
| 主分類號: | G06F30/27 | 分類號: | G06F30/27;G06F9/451;G06F3/0486;G06N20/00 |
| 代理公司: | 北京瑞盛銘杰知識產(chǎn)權代理事務所(普通合伙) 11617 | 代理人: | 李績 |
| 地址: | 100142 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 用于 聯(lián)邦 學習 圖形 模型 生命周期 建模 方法 | ||
1.一種用于聯(lián)邦學習的圖形化模型全生命周期建模方法,其特征在于,包括如下步驟:
步驟S1,建模前對數(shù)據(jù)樣本進行分析,確定聯(lián)邦學習方案,參與方上傳原始數(shù)據(jù)到建模平臺的本地客戶端后進行同態(tài)加密,加密完成后,其他參與方通過平臺請求與該參與方數(shù)據(jù)進行聯(lián)合分析運算,其中,其他參與方僅能得到聯(lián)合分析運算結果,而不會直接獲取參與方上傳的原始數(shù)據(jù);所述聯(lián)合分析運算結果以圖表形式通過可視化界面呈現(xiàn);
步驟S2,根據(jù)聯(lián)合分析運算結果,擬定建模策略,包括對數(shù)據(jù)進行的處理、加工、衍生、算法選擇的過程;
步驟S3,采用拖拉拽方式,利用聯(lián)邦特征工程手段對數(shù)據(jù)進行處理,包括:在運算時,目標變量Y標簽的所屬方先獲取對方同態(tài)加密后的X維度,進行第一次信息交換;然后進行數(shù)據(jù)運算,將運算結果返回對方進行分析調(diào)試,進行第二次信息交換如此往復;
步驟S4,聯(lián)邦模型訓練過程:雙方分別構建模型后,交換計算得到的中間態(tài)模型和損失函數(shù),如此往復迭代;
步驟S5,構建完成聯(lián)邦模型后,對所述聯(lián)邦模型進行預測使用,其中,在預測使用過程中,參與方獲知自己提供的數(shù)據(jù)變量的含義和權重,但無法獲知其他參與方提供數(shù)據(jù)的含義,僅可獲知其他參與方提供數(shù)據(jù)的權重;
步驟S6,對所述聯(lián)邦模型的運行過程進行監(jiān)控,得到模型監(jiān)控統(tǒng)計指標,實現(xiàn)對聯(lián)邦模型的維護迭代。
2.如權利要求1所述的用于聯(lián)邦學習的圖形化模型全生命周期建模方法,其特征在于,在所述步驟S1中,所述聯(lián)邦學習方案包括:橫向聯(lián)邦、縱向聯(lián)邦和遷移聯(lián)邦學習。
3.如權利要求1所述的用于聯(lián)邦學習的圖形化模型全生命周期建模方法,其特征在于,所述同態(tài)加密為對參與方上傳的原始數(shù)據(jù)進行加密,無需解密即可實現(xiàn)對加密后的數(shù)據(jù)進行分析運算,獲取分析運算結果,最后對分析運算結果進行解密;參與方和建模平臺均允許在無法獲知其他參與方的原始數(shù)據(jù)的基礎上,對加密后的數(shù)據(jù)進行運算,以對應對方數(shù)據(jù)進行模型優(yōu)化。
4.如權利要求1所述的用于聯(lián)邦學習的圖形化模型全生命周期建模方法,其特征在于,在所述步驟S2中,所述聯(lián)合分析運算結果包括:原始Y標簽有效樣本數(shù)量、橫向聯(lián)邦學習樣本交集、縱向聯(lián)邦學習總樣本量、樣本維度。
5.如權利要求1所述的用于聯(lián)邦學習的圖形化模型全生命周期建模方法,其特征在于,在所述步驟S3中,所述聯(lián)邦特征工程手段包括:編碼、分箱、特征組合、特征離散化、特征運算、時間切片、偏移量增維、PCA降維、IV特征篩選、算法特征篩選。
6.如權利要求1所述的用于聯(lián)邦學習的圖形化模型全生命周期建模方法,其特征在于,在步驟S4中,第一參與方將根據(jù)第一數(shù)據(jù)集計算所得的模型和損失函數(shù)給到第二參與方,第二參與方根據(jù)第二數(shù)據(jù)集調(diào)整模型并得到新的損失函數(shù),再由第一參與方進一步優(yōu)化,如此迭代反復,進行交換分析。
7.如權利要求1所述的用于聯(lián)邦學習的圖形化模型全生命周期建模方法,其特征在于,在所述步驟S6中,獲取模型監(jiān)控統(tǒng)計指標,包括:
參與方的雙方在本地通過平臺客戶端進行同態(tài)加密,將同態(tài)加密后的數(shù)據(jù)雙方進行數(shù)據(jù)交換,然后各自對交換后的加密數(shù)據(jù)進行計算統(tǒng)計計算,得出模型監(jiān)控統(tǒng)計指標。
8.如權利要求7所述的用于聯(lián)邦學習的圖形化模型全生命周期建模方法,其特征在于,所述模型監(jiān)控統(tǒng)計指標,包括:群體穩(wěn)定性指標PSI、洛倫茲曲線KS、曲線下面積AUC,曲線下面積AUC被定義為接受者操作特征曲線ROC曲線下與坐標軸圍成的面積,接受者操作特性曲線是指在特定刺激條件下,以被試在不同判斷標準下所得的虛報概率為橫坐標,以擊中概率為縱坐標,畫得的各點的連線。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京集奧聚合科技有限公司,未經(jīng)北京集奧聚合科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911134600.6/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 一種Agent聯(lián)邦快速設計流程建模方法
- 基于聯(lián)邦模式的動態(tài)產(chǎn)品協(xié)同開發(fā)平臺及方法
- 一種面向深空通信的數(shù)據(jù)傳輸速率控制方法
- 一種HLA聯(lián)邦成員的動態(tài)部署分配方法
- 聯(lián)邦學習方法、系統(tǒng)、終端設備及存儲介質(zhì)
- 一種混合聯(lián)邦學習方法及架構
- 聯(lián)邦學習的沙盒機制
- 聯(lián)邦模型參數(shù)確定方法、裝置、設備及存儲介質(zhì)
- 一種應用于異構計算設備的聯(lián)邦學習系統(tǒng)和方法
- 基于區(qū)塊鏈的聯(lián)邦建模方法及裝置





