[發明專利]基于公有區塊鏈和加密神經網絡的聯合學習方法及系統在審
| 申請號: | 201811440930.3 | 申請日: | 2018-11-28 |
| 公開(公告)號: | CN109698822A | 公開(公告)日: | 2019-04-30 |
| 發明(設計)人: | 李宏宇;卞杰;韓天奇;李雪峰 | 申請(專利權)人: | 眾安信息技術服務有限公司 |
| 主分類號: | H04L29/06 | 分類號: | H04L29/06;H04L9/32;G06N3/04;G06N3/08 |
| 代理公司: | 北京市萬慧達律師事務所 11111 | 代理人: | 顧友 |
| 地址: | 518000 廣東省深圳市前海深港合作區前*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 識別碼 哈希 梯度更新 區塊 加密 服務器 神經網絡模型 加密數據 神經網絡 泄露 加密數據發送 傳輸數據 收斂條件 網絡訓練 用戶信息 終端下載 通用 解密 更新 構建 上傳 預設 篡改 驗證 聯合 學習 重復 保證 | ||
本發明公開了一種基于公有區塊鏈和加密神經網絡的聯合學習方法及系統,所述方法包括:終端下載服務器上預先構建的通用神經網絡模型,使用本地數據進行訓練,獲取梯度更新數據后對其加密,獲取加密數據和第一識別碼,將加密數據發送至服務器,并計算出第一識別碼的哈希值上傳至區塊鏈,服務器對加密數據解密,獲取第二識別碼以及梯度更新數據的和,計算第二識別碼的哈希值,然后驗證第一識別碼的哈希值與第二識別碼的哈希值是否一致,若一致,使用梯度更新數據的和對通用神經網絡模型進行更新,否則,不更新,重復上述步驟,直至模型滿足預設的收斂條件。本發明在完成深度網絡訓練的過程中,可防止用戶信息被泄露,保證傳輸數據不泄露、不被篡改。
技術領域
本發明涉及區塊鏈技術領域,特別涉及一種基于公有區塊鏈和加密神經網絡的聯合學習方法及系統。
背景技術
深度學習是機器學習領域的一種常用學習方法,其特點是利用深度神經網絡和大量數據對模型進行訓練。其中不可缺少的就是訓練數據,目前訓練數據的來源很多都是用戶在使用產品的過程中所產生,其中涉及到一些用戶的使用習慣,如使用頻率,使用時間,個人偏好等等。傳統的深度學習項目都是將用戶的這些數據收集到服務器端然后再進行大規模的訓練,這樣就讓用戶對個人數據的隱私問題產生了擔憂。
聯合學習(federated learning)是美國Google公司提出的一種能使多臺客戶端計算設備以協作的形式,訓練共享的預測模型。聯合學習通常的訓練過程是首先服務器端給客戶端計算設備下發初始模型,之后客戶端計算設備根據本地自身的數據對模型進行訓練,訓練完成后將模型的梯度更新發送到服務端,服務端整合所有發送過來的梯度更新數據,作為模型的一次更新,然后將更新后的模型再次發送到客戶端計算設備,重復之前的訓練過程,直到服務器端的模型收斂,這樣就達到了在不傳輸個人數據的同時完成了模型的訓練,保證了用戶數據的安全。然而即使只傳輸梯度信息,仍然在一定程度上可能泄漏用戶信息,因此如何保證客戶端計算設備傳輸的梯度信息不泄露就成為了聯合學習的一個亟待解決的問題。
聯合學習的另一個問題是:雖然有考慮到用戶的隱私問題,但是在客戶端計算設備和服務端通信過程中數據存在被篡改可能,無法確保客戶端計算設備發送的數據與服務端接收到的數據的一致性。
近幾年區塊鏈技術的研究與應用呈現出迅猛增長態勢。區塊鏈技術通過去中心化,運用數據加密、時間戳、分布式共識和經濟激勵等手段,在節點無需互相信任的分布式系統中實現基于去中心化信用的點對點交易、協調與協作,從而為解決中心化機構普遍存在的高成本、低效率和數據存儲不安全等問題提供了解決方案。區塊鏈具有可溯源、不可篡改、匿名等優勢。其中公有鏈是完全去中心化的,沒有任何個人或者機構可以控制或篡改其中數據的讀寫。
綜上所述,如何在完成深度網絡訓練的過程中,不泄漏用戶信息,以及保證傳輸數據不被篡改等問題亟需解決。
發明內容
為了解決現有技術的問題,本發明實施例提供了一種基于公有區塊鏈和加密神經網絡的聯合學習方法及系統,以克服現有技術中如何在完成深度網絡訓練的過程中,不泄漏用戶信息,以及保證傳輸數據不泄露、不被篡改等問題。
為解決上述技術問題,本發明采用的技術方案是:
一方面,提供了一種基于公有區塊鏈和加密神經網絡的聯合學習方法,所述方法包括如下步驟:
S1:終端下載服務器上預先構建的通用神經網絡模型,使用本地數據進行訓練,獲取梯度更新數據;
S2:所述終端對所述梯度更新數據進行加密,獲取加密數據和第一識別碼,并將所述加密數據發送至所述服務器;
S3:所述終端通過預定義的哈希函數計算出所述第一識別碼的哈希值,并上傳至區塊鏈;
S4:所述服務器對所述加密數據進行解密,獲取第二識別碼以及梯度更新數據的和,使用預定義的哈希函數計算所述第二識別碼的哈希值;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于眾安信息技術服務有限公司,未經眾安信息技術服務有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811440930.3/2.html,轉載請聲明來源鉆瓜專利網。





