[發明專利]基于多方隱私協作的k均值聚類的聯邦學習方法、系統在審
| 申請號: | 202210726755.4 | 申請日: | 2022-06-24 |
| 公開(公告)號: | CN115130123A | 公開(公告)日: | 2022-09-30 |
| 發明(設計)人: | 王小偉;張旭;吳睿振;孫華錦;王凜 | 申請(專利權)人: | 蘇州浪潮智能科技有限公司 |
| 主分類號: | G06F21/60 | 分類號: | G06F21/60;G06F21/62;G06K9/62;G06N20/20 |
| 代理公司: | 濟南舜源專利事務所有限公司 37205 | 代理人: | 楊彬 |
| 地址: | 215100 江蘇省蘇州*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 多方 隱私 協作 均值 聯邦 學習方法 系統 | ||
本發明屬于隱私保護處理技術領域,具體提供一種基于多方隱私協作的k均值聚類的聯邦學習方法、系統,所述方法包括如下步驟:將客戶端數據進行預處理;每個客戶端將聚類中心點的初始值加密后發送至服務器,接收服務器的處理結果,客戶端選擇兩個聚類中心點,結合處理結果在密文上計算數據點與這兩個聚類中心點的差,并將差的坐標打亂后發送至服務器;服務器計算數據點與聚類中心點的距離,并將距離的大小關系反饋給客戶端;每個客戶端通過判斷每個數據點與第幾個聚類中心點的距離最近,得到數據所屬的類別;分別對屬于同一類別的數據使用同一模型進行聯邦學習,進而得到每一類數據的個性化的預測。減小數據加密長度,從而提高了的運行效率。
技術領域
本發明涉及隱私保護處理技術領域,具體涉及一種基于多方隱私協作的k均值聚類的聯邦學習方法、系統。
背景技術
隨著人工智能的發展,機器學習被廣泛地應用于眾多領域,例如推薦系統、垃圾郵件過濾、人臉識別等。近年來,由于人們對個人隱私日益關注,而傳統的機器學習模式容易造成個人隱私信息的泄露。聯邦學習作為一種基于云計算的機器學習技術,能夠起到保護用戶隱私的作用。在聯邦學習中,由于數據來源于各種各樣的終端設備,會很自然地產生數據異質性問題,也就是說這些數據是非獨立同分布的(non-IID)。比較早的聯邦學習方法中,所有的用戶數據都帶入同一個全局模型中訓練,訓練完成之后,所有的用戶也都使用同一個模型進行預測。這種做法將non-IID的數據作為獨立同分布的數據進行了處理,忽略了用戶數據之間的差異,從而不能產生一些個性化的預測。
近年來有一些學者采取建立多個全局模型的方式,對non-IID的用戶數據進行聯邦學習。假設來自同一客戶端的數據是獨立同分布(IID)的。事實上,在一些領域中,用于學習的數據的來源十分復雜,同一個客戶端的數據也有可能來源于各種不同類型的實體。比如醫院的就診情況、共享設施的使用情況等等。這時候需要對客戶端數據進行聚類,然后在每個類別中分別進行機器學習,這樣我們就能對一些特定類型的用戶問題產生一些更具有針對性的方案。
k-means方法是一種基礎的聚類方法,大多數聚類方法都是由此方法衍生而來的。近幾年有許多學者在多方k-means聚類的隱私保護方面做出了大量的工作。目前主要有以下三種方法;1、全同態加密方法。此類方法的保密性較好,但是其主要缺點是計算效率比較低。例如Angela Jaschke等人使用全同態加密技術將數據加密,起到對隱私數據地保護作用,然后由服務器在密文上進行各種運算,這會給服務器造成較大的負擔,當數據量較大時,運行效率非常低。2、多方安全計算方法。這類方法的計算效率較高,主要缺點是通訊花費比較高。例如Payman Mohassel等人通過優化1-out-of-n不經意傳輸,并結合混淆電路提高了安全乘法和歐幾里得距離的計算效率,但是它在通訊上的花費依然比較高。3、差分隱私方法。這種方法的計算效率和保密性都比較好,但是它往往會產生過多的噪聲,而導致結果的可用性降低。例如將Kobbi Nissim等人的聚類方案應用到多方聯合計算后,就會使每個數據點被加上過多的噪聲,從而導致聚類結果嚴重失真。
發明內容
針對現有的聚類方法隱私保護中存在的問題,本發明提供一種基于多方隱私協作的k均值聚類的聯邦學習方法、系統。
本發明的技術方案是:
第一方面,本發明技術方案提供一種基于多方隱私協作k聚類方法的聯邦學習方法,包括如下步驟:
S1:將客戶端數據進行預處理;
S2:每個客戶端將聚類中心點的初始值加密后發送至服務器;
S3:客戶端接收服務器對聚類中心點的處理結果;
S4:客戶端選擇兩個聚類中心點,結合接收到的處理結果,在密文上計算數據點與所述兩個聚類中心點的差,并將差的坐標打亂后發送至服務器;
S5:服務器計算數據點與聚類中心點的距離,并將距離的大小關系反饋給客戶端;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于蘇州浪潮智能科技有限公司,未經蘇州浪潮智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210726755.4/2.html,轉載請聲明來源鉆瓜專利網。





