[發明專利]一種基于安全兩方計算線性回歸算法的數據隱私保護系統在審
| 申請號: | 202011004265.0 | 申請日: | 2020-09-22 |
| 公開(公告)號: | CN112182649A | 公開(公告)日: | 2021-01-05 |
| 發明(設計)人: | 魏立斐;張蕾;李夢思;陳聰聰 | 申請(專利權)人: | 上海海洋大學 |
| 主分類號: | G06F21/62 | 分類號: | G06F21/62;H04L9/00;H04L9/08;H04L29/06 |
| 代理公司: | 上海申浩律師事務所 31280 | 代理人: | 張潔 |
| 地址: | 201306 上*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 安全 計算 線性 回歸 算法 數據 隱私 保護 系統 | ||
本發明公開了一種基于安全兩方計算的線性回歸算法,所述方法包括以下步驟:步驟S1:采用秘密共享值的乘法;步驟S2:訓練數據預處理;步驟S3:參數初始化;S4:模型參數更新;步驟S5:預測數據預處理;步驟S6:計算預測共享值;步驟S7:重構預測結果。本文方案在保證數據和模型參數隱私不被泄露的同時,所需要的通信開銷更低。本申請將原始訓練數據和模型參數私有化,在云服務器無法獲得原始訓練數據以及中間參數、并且無法推斷模型參數的情況下,借助云服務的便利實現了一種保護數據隱私的線性回歸算法;在此基礎上,可安全地執行回歸預測任務,在利用云服務器的計算及存儲資源時,可高效準確的進行線性回歸模型的訓練及數據預測。
技術領域
本發明涉及信息安全技術私領域,具體涉及一種基于安全兩方計算線性回歸算法的數據隱私保護系統。
背景技術
線性回歸(Linear Regression)是一種以線性模型來建模一個或多個自變量與因變量關系的方法,其核心思想是將一系列的影響因素和結果進行擬合,從而勾畫出因變量與自變量之間的相關關系。作為一種經典的算法,目前廣泛應用于統計分析及機器學習領域。為了刻畫最優的線性回歸模型,往往需要由不同的數據提供方提供大量的原始數據發送給云服務器進行集中訓練,但云服務器往往是不可信甚至惡意的,所以研究如何在不泄露用戶數據隱私的情況下利用云服務安全高效的處理回歸任務是有意義的。
目前有學者關于回歸任務數據隱私保護問題,提出使用同態加密來實現的方案。同態加密允許人們對密文進行特定形式的代數運算得到仍然是加密的結果,將其解密所得到的結果與對明文進行同樣的運算結果一樣,這滿足訓練回歸模型中的數據隱私保護要求。這種方案不需要大量交互,但計算開銷很大。首先使用同態加密算法對數據進行同態加密,然后進行模型訓練,最后對結果進行同態解密即可完成訓練任務,可以同時實現原始數據和模型參數的隱私保護。現在大多數同態加密算法效率不高,因此使用同態加密方案解決數據的隱私性保護問題實用性不強。
另外,也有一些學者提出通過安全多方計算的方式來實現安全的線性回歸任務。這種方案的主要特點是計算廉價。利用兩方甚至多方之間的大量交互取代昂貴的計算開銷,同時還可以滿足原始數據和模型參數的隱私保護要求。因此,使用安全多方計算來解決數據的隱私保護問題是目前研究的主流方向之一。由于當前應用于機器學習的安全多方計算方案需要借助其他的一些密碼學技術(比如不經意傳輸協議、同態加密等),故它的主要挑戰是如何通過多方構建一個安全且效率較高的計算協議。
2011年,Hall等人基于同態加密首次提出了一種可以達到安全性定義的安全兩方計算線性回歸協議,但過于依賴計算開銷巨大的同態加密,該方案無法應用到數據條目龐大的數據集中。Martine等人基于文獻在數據集分布于多個參與方的情境下,提出了一種能夠保護數據隱私的線性回歸方案,各計算方可以在不共享自己私有數據集的情況下協同訓練線性回歸模型。Dankar通過引入一個半可信第三方,在理論上提出了一種支持多個數據提供者參與的隱私保護線性回歸方案。Adrià等人提出一種用于任意分布于多個參與方的訓練集的隱私保護線性回歸方案,該方案結合了Yao的混淆電路和全同態加密方案。之后,Mohassel等人提出的SecureML方案基于混淆電路和不經意傳輸(Oblivious Transfer,OT)協議設計了支持安全兩方計算的隨機梯度下降算法,實現了線性回歸、邏輯回歸以及神經網絡的模型訓練任務,該方案由數據擁有者將私有數據通過秘密共享的方式分發給兩個服務器,由兩個服務器用安全多方計算的方式訓練模型,實現了加法和乘法的分布式計算。在SecureML的基礎上,唐等人借助基于OT協議生成的乘法三元組,提出了具有隱私性的回歸模型訓練算法,同時實現了對訓練數據及模型參數的隱私保護。Akavia等人提出一種能夠從多個數據所有者提供的數據集中學習線性回歸模型的數據隱私保護方案,該方案使用兩個非共謀服務器和線性同態加密(Linearly Homomorphic Encryption)來學習正則化線性回歸模型。Dong等人提出了一個可以適應半誠實和惡意環境下的分布式機器學習框架,每個參與者將自己的梯度分成共享份額,并分配給多個參數服務器,由參數服務器聚合梯度后發還給參與者,參與者在本地更新參數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海海洋大學,未經上海海洋大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011004265.0/2.html,轉載請聲明來源鉆瓜專利網。





