[發明專利]用于安全隱私數據聚合的設備和方法在審
| 申請號: | 202180038368.5 | 申請日: | 2021-04-01 |
| 公開(公告)號: | CN115956244A | 公開(公告)日: | 2023-04-11 |
| 發明(設計)人: | 詹姆斯·里德·戴斯蒙德·亞瑟;盧克·安東尼·威廉·羅賓遜;哈里·理查德·基恩 | 申請(專利權)人: | 朦朧有限公司 |
| 主分類號: | G06F21/62 | 分類號: | G06F21/62 |
| 代理公司: | 深圳尚業知識產權代理事務所(普通合伙) 44503 | 代理人: | 文蓉 |
| 地址: | 英國肯特塞文奧克斯巴克赫*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 安全 隱私 數據 聚合 設備 方法 | ||
一種能夠對多個原始數據集進行分析,同時保護原始數據集內的信息的隱私的計算機系統,該系統包括多個合成數據生成器和數據集線器。每個合成數據生成器被配置為:訪問存儲在多個原始數據存儲中的對應的一個原始數據存儲中的對應的原始數據集;基于所述對應的原始數據集產生合成數據生成器模型,所述合成數據生成器模型被配置為生成表示所述對應的原始數據集的合成數據集;以及將包括所述對應的合成數據集和所述合成數據生成器模型中的至少一個的合成信息推送到所述數據集線器。所述數據集線器被配置成存儲從所述合成數據生成器接收的所述合成信息以供一個或多個客戶端訪問以進行分析。所述系統被配置成使得所述數據集線器不能直接訪問所述原始數據集,并且使得所述合成數據信息只能從所述合成數據生成器推送到所述數據集線器。
技術領域
本公開涉及能夠對多個原始數據集進行分析同時保護原始數據集內的信息的隱私的計算機系統和計算機實施方法。特別地,但不限于,本公開涉及能夠對來自多個安全源的匿名數據進行安全分析和建模而不損害原始數據源的安全性或隱私的裝置。
背景技術
機器學習和數據分析的進步,見證了原始數據價值的增長。隨著原始數據價值的增長,維護數據安全性變得越來越重要,不僅是為了安全,也是為了維護隱私和遵守當地法規。
雖然單個數據集可能足以訓練用于一些應用的機器學習系統,但是在某些情況下,可以通過增加訓練數據集的大小來顯著改善性能。單個公司通常難以獲得足夠量的數據來有效地訓練機器學習模型。因此,可以通過組合來自不同來源(例如,來自不同公司)的數據來獲得性能的改進。
如上所述,考慮到原始數據的價值和維護隱私的要求,重要的是維護數據安全性。一些計算機系統具有嚴格的中國墻來保護信息并遵守當地法規(例如,在銀行業內)。同樣,由于需要維護用戶隱私,許多公司和研究組不能共享原始的非匿名數據。這可能使得跨不同數據源間的數據分析變得困難。
發明內容
鑒于上述情況,需要一種收集或聚合來自不同源的數據并分析數據,同時保持原有的原始數據的安全性和隱私的改進的手段。當數據是在可信計算環境之外或在彼此不完全信任的用戶或系統之間共享的情況下,這是特別重要的。例如,個人數據可以受到法律或法規的保護,在實體之間(例如企業之間)或跨境共享數據可能被禁止。
解決此問題的一個方法是利用聯合機器學習。盡管如此,聯合機器學習存在關于跨多個源的歸一化數據以及給予系統對每個數據源的訪問的要求的問題。此外,聯合機器學習可能存在關于共享預測誤差的隱私問題。此外,聯合機器學習不允許將不同的隱私約束應用于不同的信息源。
為了解決上述問題,本文描述的實施例通過生成和共享合成數據來保護在原始數據中表示的個體的隱私,所述合成數據共享原始數據的屬性,但不損害原有的原始數據的安全性或隱私。本文描述的具體實施例通過在可信環境內實施合成數據生成器并在數據集線器中跨多個源收集合成數據來提高數據安全性并減少網絡的攻擊面。數據集線器可以充當保護原始數據源免受攻擊的基礎主機,從而減少網絡的攻擊面。
為了保護原始數據源,網絡被配置成使得合成數據只能從合成數據生成器推送,并且因此不能通過數據集線器從合成數據生成器拉取。客戶(例如,數據科學家)可以經由數據集線器從多個源訪問合成生成的數據,以分析數據(例如,在合成數據上訓練機器學習模型)。
此外,為了保護原始數據源中引用的個體的隱私,所述合成生成器可以被配置為生成所述合成數據,以便符合設定的隱私級別(例如,設定的差異隱私級別)。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于朦朧有限公司,未經朦朧有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202180038368.5/2.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





