[發(fā)明專利]分布式支持向量機隱私保護方法、系統(tǒng)、存儲介質(zhì)及應(yīng)用有效
| 申請?zhí)枺?/td> | 202110054339.X | 申請日: | 2021-01-15 |
| 公開(公告)號: | CN112765657B | 公開(公告)日: | 2023-01-06 |
| 發(fā)明(設(shè)計)人: | 馬立川;黃子君;裴慶祺;王磊 | 申請(專利權(quán))人: | 西安電子科技大學(xué);西安鏈融科技有限公司 |
| 主分類號: | G06F21/62 | 分類號: | G06F21/62;G06N20/10 |
| 代理公司: | 西安長和專利代理有限公司 61227 | 代理人: | 黃偉洪 |
| 地址: | 710071 陜西省*** | 國省代碼: | 陜西;61 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 分布式 支持 向量 隱私 保護 方法 系統(tǒng) 存儲 介質(zhì) 應(yīng)用 | ||
本發(fā)明屬于數(shù)據(jù)隱私保護技術(shù)領(lǐng)域,公開了一種分布式支持向量機隱私保護方法、系統(tǒng)、存儲介質(zhì)及應(yīng)用,通過所有參與實體之間通過秘密共享分割秘密,迭代交互自身分割的部分信息,本地求解子問題;迭代至收斂,求解全局最優(yōu)解;考慮隱私保護方法的一般性,分別采用數(shù)據(jù)縱向分布和橫向分布的隱私保護方法;參與實體互不信任,通過多方計算技術(shù)進行交互和本地訓(xùn)練。本發(fā)明在誠實好奇的場景下,利用分割數(shù)據(jù)的思想,通過用戶之間交互部分數(shù)據(jù)進行本地計算,最后重構(gòu)秘密來保護數(shù)據(jù)隱私;將此數(shù)據(jù)進行分割后,與協(xié)作用戶各拿一部分進行本地計算,因此合作方完全得不到其他用戶的相關(guān)隱私信息,能得到有明確含義的信息只有自己的值和最后計算的結(jié)果。
技術(shù)領(lǐng)域
本發(fā)明屬于數(shù)據(jù)隱私保護技術(shù)領(lǐng)域,尤其涉及一種分布式支持向量機隱私保護方法、系統(tǒng)、存儲介質(zhì)及應(yīng)用。
背景技術(shù)
目前:在當(dāng)今的信息時代,數(shù)據(jù)的增長呈現(xiàn)爆炸性,隨著計算機系統(tǒng)的規(guī)模變得越來越大,分布式的處理方式越來越受到業(yè)界的青睞。另外由于如今機器學(xué)習(xí)算法被應(yīng)用到各個領(lǐng)域,考慮分布式的處理方式,可以處理更大規(guī)模的樣本量,將會更好的發(fā)揮機器學(xué)習(xí)算法的優(yōu)勢,使得算法可以大規(guī)模應(yīng)用。而其中支持向量機是最廣泛使用的機器學(xué)習(xí)算法之一。在以往的研究中,求解支持向量機等機器學(xué)習(xí)最優(yōu)化問題一般用ADMM算法。與此同時,用于訓(xùn)練的數(shù)據(jù)是由多個實體擁有,而數(shù)據(jù)的敏感性阻礙了將數(shù)據(jù)共享并訓(xùn)練。多數(shù)分布式算法都要求節(jié)點在每次迭代中向相鄰節(jié)點明確交換并公開狀態(tài),這意味著在許多實際的分布式應(yīng)用存在著嚴重隱私問題。僅僅將原始數(shù)據(jù)保存在本地對于隱私保護而言是遠遠不夠的,需要對實現(xiàn)分布式ADMM算法過程中的交互參數(shù)來進行隱私保護。因此論文將基于支持向量機場景,研究ADMM算法的隱私保護技術(shù)。
然而現(xiàn)有的關(guān)于支持向量機場景的隱私保護研究在隱私和準(zhǔn)確率方面仍然面臨一些亟待解決的挑戰(zhàn)。為了在分布式優(yōu)化算法中隱私保護,有兩種常用的方法。第一類是擾動方法,主要利用的技術(shù)是差分隱私。這類方法的效率高,但是添加噪聲會造成數(shù)據(jù)可用性的損失,損害優(yōu)化結(jié)果的準(zhǔn)確性。盡管有相關(guān)研究在隱私性和準(zhǔn)確性之間進行了權(quán)衡,但收斂到最優(yōu)分類器的速度總是會減慢。第二類是密碼學(xué)方法,包括安全多方技術(shù)和同態(tài)加密。同態(tài)加密方法的計算開銷過高,難以應(yīng)用于現(xiàn)實。另外在目前研究中,大多數(shù)支持向量機隱私保護的場景僅是分布式部署數(shù)據(jù),單機處理。也就是沒有考慮多機器多數(shù)據(jù)源的完全分布式的支持向量機算法協(xié)作訓(xùn)練時信息交互的隱私泄露問題。少部分研究工作有關(guān)注這一方面,但是對數(shù)據(jù)橫向和縱向分布的情況并沒有充分解決。
通過上述分析,現(xiàn)有技術(shù)存在的問題及缺陷為:現(xiàn)有的分布式支持向量機存在計算開銷和安全性的矛盾,安全性高的方法存在計算開銷大的問題,效率高的方法存在安全性的問題。另外,還要考慮機器學(xué)習(xí)的場景,需要兼顧訓(xùn)練結(jié)果的準(zhǔn)確性。
解決以上問題及缺陷的難度為:解決機器學(xué)習(xí)訓(xùn)練過程中中間態(tài)交互計算的隱私問題,雖然同態(tài)加密能進行多方的安全計算,但是帶來高計算復(fù)雜度問題。
解決以上問題及缺陷的意義為:若能采用一種效率高同時保證多方計算安全的方法處理數(shù)據(jù),完成機器學(xué)習(xí)訓(xùn)練,達到同態(tài)加密的同等效果而不需要巨大的額外開銷,保證訓(xùn)練結(jié)果準(zhǔn)確率的前提下,保護數(shù)據(jù)隱私。
發(fā)明內(nèi)容
針對現(xiàn)有技術(shù)存在的問題,本發(fā)明提供了一種分布式支持向量機隱私保護方法、系統(tǒng)、存儲介質(zhì)及應(yīng)用。
本發(fā)明是這樣實現(xiàn)的,一種分布式支持向量機隱私保護方法,所述分布式支持向量機隱私保護方法通過所有參與實體之間通過秘密共享分割秘密,迭代交互自身分割的部分信息,本地求解子問題;迭代至收斂,求解全局最優(yōu)解;考慮隱私保護方法的一般性,分別采用數(shù)據(jù)縱向分布和橫向分布的隱私保護方法;參與實體互不信任,通過多方計算技術(shù)進行交互和本地訓(xùn)練。
進一步,所述分布式支持向量機隱私保護方法具體包括:
步驟一,建立多數(shù)據(jù)源的網(wǎng)絡(luò)通信環(huán)境;
步驟二,根據(jù)數(shù)據(jù)源數(shù)據(jù)分布選擇縱向或者橫向分布的支持向量機場景;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于西安電子科技大學(xué);西安鏈融科技有限公司,未經(jīng)西安電子科技大學(xué);西安鏈融科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110054339.X/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





