[發明專利]一種對等網絡中基于可驗證聚合和差分隱私的異步聯邦學習方法有效
| 申請號: | 202111657350.1 | 申請日: | 2021-12-30 |
| 公開(公告)號: | CN114363043B | 公開(公告)日: | 2023-09-08 |
| 發明(設計)人: | 張磊;高圓圓;姚鑫 | 申請(專利權)人: | 華東師范大學 |
| 主分類號: | H04L9/40 | 分類號: | H04L9/40;H04L9/32;H04L67/104;G06F21/60;G06F21/64;G06F21/62;G06N20/00 |
| 代理公司: | 上海藍迪專利商標事務所(普通合伙) 31215 | 代理人: | 徐筱梅;張翔 |
| 地址: | 200241 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 對等 網絡 基于 驗證 聚合 隱私 異步 聯邦 學習方法 | ||
1.一種對等網絡中基于可驗證聚合和差分隱私的異步聯邦學習方法,其特征在于,所述方法包括如下步驟:
1)系統初始化階段:
a)客戶端數據庫初始化:在對等網絡環境下參與異步聯邦學習的第i個客戶端用ui表示,每一個客戶端ui分別維護自己的本地數據集Di={(x1,y1),...,(xn,yn)},其中xi為該客戶端數據集中第i個數據的特征值,yi為第i個數據的標簽值;在系統初始化階段,由客戶端ui對自己的本地數據集Di進行劃分,其中訓練集用于模型訓練,驗證集用于在模型驗證階段對接收到的模型更新進行篩選;
b)通信參數初始化:模型更新通過建立可信信道進行傳輸;CA為可信第三方機構,參與可信信道的搭建;可信第三方CA在初始化階段生成建立信道必要的系統參數;
2)注冊階段:
可信第三方CA首先生成一組公私密鑰對,其中CA生成的公鑰表示為mpk,私鑰表示為msk,該組公私密鑰對以(msk,mpk)進行表示,并指定簽名方案∑,CA將使用簽名方案∑為在聯邦學習系統中的各個客戶頒發簽名證書以提供客戶端的身份認證;簽名方案∑和CA公私密鑰對中的公鑰mpk都由CA進行公開;系統中的每一個客戶端都會生成自己的公私密鑰對,其中,客戶端ui生成的公鑰用表示,私鑰用表示,該組公私密鑰對用表示,該公私密鑰對與簽名方案∑對應;客戶端ui將它的公鑰發送給可信第三方CA,由CA為每一個客戶端生成用其私鑰msk簽名的成員證書,使得系統中客戶端的身份都能夠得到認證;
3)本地模型訓練階段:
客戶端根據初始化階段分割的訓練集進行本地模型訓練;首次訓練時,生成初始化模型用表示,將作為訓練的初始模型,對于進行第t輪模型訓練的用戶訓練模型為設置最大訓練輪次為T,當前訓練輪次以t表示,客戶端ui進行t輪訓練得到的模型表示為設置第t輪訓練中的隱私預算參數為εt,隱私預算εt用于實現本地差分隱私時控制添加的噪聲干擾量,采用高斯機制添加噪聲,噪聲分布服從均值為0,標準差為的高斯分布N(0,σ2);為了抵抗來自半誠實的客戶端或惡意客戶端的推理攻擊,引入本地差分隱私方法來保護隱私數據不受好奇或惡意客戶端的影響,方法如下:客戶端通過添加噪聲進行擾亂,在保證模型精度的同時對數據隱私進行有效保護,對于進行第t輪模型訓練的客戶端ui,其本地模型為在將這個本地模型發送給其他客戶端之前,客戶端ui根據設置的隱私預算εt控制添加的噪聲量,通過計算添加噪聲得到用于分發的模型實現本地差分隱私;
4)模型分發階段:
當客戶端完成本地模型訓練后,進入模型分發與驗證階段;在異步聯邦學習中,允許每個客戶端進行的訓練輪次不一致,也允許接受到來自周圍客戶端的模型個數不一致;
模型分發階段中:客戶端ui將選擇周圍通信條件好的m個客戶端,并向選擇的m個客戶端發送本地訓練得到的模型;由可信安全信道保證傳輸數據的安全,模型數據在傳輸過程中無法被外部敵手獲取;
5)模型聚合階段:
在對等網絡中,客戶端各自對模型進行更新與聚合,不設置中心聚合服務器,客戶端ui在第t輪模型訓練時接收到的來自客戶端uj的模型更新為來自其他客戶端的模型更新的準確性由各客戶端自行驗證,通過驗證的模型更新將用于模型聚合生成新的模型;
客戶端ui在驗證階段首先根據自身精度要求指定一個精度參數β(0β≤1),β的基準值為0.5,β值越大,精度要求越高;然后先進行數據集質量驗證,再進行模型更新質量驗證,具體如下:
a)訓練數據集質量驗證:根據收到的來自其他客戶端的模型更新與本地模型的相似性評估其他客戶端的數據集質量,以驗證其他客戶端的數據集是否遭遇投毒攻擊;計算模型更新與本地模型的余弦值來計算相似度:首先計算客戶端ui的本地模型與接收到的客戶端uj的模型更新之間的內積μ(ui,uj),即:
然后通過下式計算本地模型和更新模型的余弦值cos(ui,uj):
各客戶端將根據驗證結果獨立選擇是否采用接收到的模型更新;如果本地模型和更新模型的余弦值cos(ui,uj)小于參數β,則訓練該更新模型的數據集質量較低,可能受到投毒攻擊;
b)模型更新質量驗證:當模型更新通過數據集質量驗證后,進行臨時聚合,然后利用測試集數據對臨時聚合模型的精度進行測試,如果臨時聚合模型的精度低于本地模型,客戶端將放棄這種低質量的模型更新,繼續使用本地模型進行訓練;為了防止服務器獲取原始的模型更新來推斷客戶端的隱私信息,采用一種異步聚合方法,對于由k個客戶端組成的集合U={u1,u2,...,uk}其中每一個客戶端ui都保有自己的數據集Di,Di是整個聯邦學習的整體用戶數據集{∪Di}的一個子集;在異步聯邦學習中,客戶端ui的目標就是去通過模型訓練獲得最優模型M,模型M是由特征值x作為自變量,模型參數w作為自變量系數的函數h(w,x),即M=h(w,x);Lj(w)是模型參數為w的模型對于第j個樣本的損失函數,Fi(w)是模型參數為w的模型對于客戶端ui數據集Di的平均損失函數,則模型訓練的優化目標為:
異步聯邦學習中每個客戶端的訓練目標就是使自身的損失函數最小化,各客戶端在本地使用梯度下降算法進行模型聚合訓練;客戶端將利用通信條件好的m個客戶端發來的數據,進行模型更新得到聚合模型聚合方法如下:
通過兩種驗證方法,能夠避免聚合低質量的模型,從而有效提高模型的性能;客戶端基于本次迭代的模型結果繼續在自己的數據集上運行機器學習算法,利用隨機梯度下降訓練一個新的本地模型;
重復上述階段3)至階段5),直到達到最大迭代次數T。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華東師范大學,未經華東師范大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111657350.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種生產線產品自動挑選裝置
- 下一篇:一種基于微服務區塊鏈的智能合約運行方法





