[發明專利]一種基于聯邦學習的防竊取攻擊醫療診斷模型保護方法在審
| 申請號: | 202110422407.3 | 申請日: | 2021-04-20 |
| 公開(公告)號: | CN112967812A | 公開(公告)日: | 2021-06-15 |
| 發明(設計)人: | 鄭子彬;李世璇;陳川 | 申請(專利權)人: | 鐘愛健康科技(廣東)有限公司 |
| 主分類號: | G16H50/50 | 分類號: | G16H50/50;G06F21/62;G06N20/20;G06N3/08 |
| 代理公司: | 北京沃知思真知識產權代理有限公司 11942 | 代理人: | 王茜 |
| 地址: | 529700 廣東省*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 聯邦 學習 竊取 攻擊 醫療 診斷 模型 保護 方法 | ||
1.一種基于聯邦學習的防竊取攻擊醫療診斷模型保護方法,其特征在于,該醫療診斷模型保護方法具體步驟如下:
S1、假設有N個醫療機構各收集N個敏感醫療數據集,各機構基于這些數據集獨立訓練不同的本地模型,得到N個teacher;
S2、在各醫療機構本地部署訓練好的teacher,記錄每一個teacher的預測結果,用于最終結果投票;
S3、引入拉普拉斯噪聲,將票數的統計情況打亂,實現差分隱私保護;
S4、在聯邦全局服務器聚合所有teacher的預測結果并進行投票,選取票數最高的作為最終結果,得到aggregated teacher;
S5、在聯邦全局服務器用aggregated teacher對無標簽的脫敏公共數據集進行標注,得到有標簽脫敏公共數據集;
S6、在聯邦全局服務器用步驟S5得到的有標簽脫敏公共數據集訓練新的深度神經網絡模型student;
S7、將訓練好的student提供給用戶使用。
2.根據權利要求1所述的一種基于聯邦學習的防竊取攻擊醫療診斷模型保護方法,其特征在于:步驟S3中實現差分隱私保護的具體過程為:
SS1、在聯邦全局服務器統計N個醫療機構本地訓練的teacher模型的投票情況,形成聚合結果;
SS2、如果大部分teacher模型都同意某個預測結果,則不依賴于具體的分散數據集,即隱私成本很小;如果兩類預測結果有相近的票數,則這種不一致或許會泄露隱私信息,因此在投票形成aggregated teacher前,增加差分隱私;
SS3、把聯邦全局服務器聚合的aggregated teacher視為差分隱私模塊,用戶提供輸入數據,aggregated teacher能返回保護隱私的標簽。
3.根據權利要求2所述的一種基于聯邦學習的防竊取攻擊醫療診斷模型保護方法,其特征在于:步驟SS2中所述差分隱私步驟具體為:引入拉普拉斯噪聲,把票數的統計情況打亂,保護隱私。
4.根據權利要求1所述的一種基于聯邦學習的防竊取攻擊醫療診斷模型保護方法,其特征在于:步驟S6訓練新的深度神經網絡模型student的主要因素為:
(1)步驟S4中的aggregated teacher的差分隱私保護有限,如果攻擊者多次調用aggregated teacher差分隱私模塊,則可能會通過輸出結果獲得某些隱私信息;
(2)步驟S6中的深度神經網絡模型student是脫敏的模型,可在用戶設備上直接運行,能避免攻擊者直接多次調用aggregated teacher差分隱私模塊。
5.根據權利要求1所述的一種基于聯邦學習的防竊取攻擊醫療診斷模型保護方法,其特征在于:步驟S6中的深度神經網絡模型student是基于未標記的脫敏公共數據集訓練的,且在訓練深度神經網絡模型student前,需在聯邦全局服務器先用aggregated teacher對該脫敏公共數據集完成標注。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于鐘愛健康科技(廣東)有限公司,未經鐘愛健康科技(廣東)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110422407.3/1.html,轉載請聲明來源鉆瓜專利網。





