[發明專利]去中心化的數據分析方法、系統以及介質在審
| 申請號: | 201811610257.3 | 申請日: | 2018-12-27 |
| 公開(公告)號: | CN109670583A | 公開(公告)日: | 2019-04-23 |
| 發明(設計)人: | 吳增德;吳曉東;沈樂平;陳玲瓏 | 申請(專利權)人: | 浙江省公眾信息產業有限公司 |
| 主分類號: | G06N3/063 | 分類號: | G06N3/063;G06N3/08;G06N99/00;G06F16/25 |
| 代理公司: | 中國國際貿易促進委員會專利商標事務所 11038 | 代理人: | 張鑫 |
| 地址: | 310012 浙江*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 模型訓練 數據分析 中心化 結點 模型文件 機器學習模型 匯聚 | ||
本公開涉及去中心化的數據分析方法、系統以及介質。去中心化的數據分析方法包括以下步驟:將用于進行數據分析的機器學習模型的模型文件發送給多個工作結點;從所述多個工作結點接收多個模型訓練結果,其中所述多個模型訓練結果是分別由所述多個工作結點根據所述模型文件進行模型訓練得到的;根據接收到的所述多個模型訓練結果,生成匯聚的模型訓練結果。
技術領域
本公開涉及去中心化的數據分析方法、系統以及介質。
背景技術
機器學習有三大要素:數據、算力、算法。近幾年機器學習巨大發展的關鍵因素是數據、算力和算法的快速發展。圖1示出了現有的機器學習模型。該模型中各個數據結點把數據匯集到機器學習結點。機器學習結點將數據加標注后,用這些數據訓練機器學習模型。
發明內容
本申請的發明人發現集中式機器學習模型在機器學習三大要素方面都存在很大的局限性。在數據方面,機器學習開發是基于所收集的數據進行的,但由于需要的數據量巨大以及容易產生隱私數據泄漏,很難把各個企業的數據匯集到一起有效開發。在算力方面,很多企業以及研究機構擁有強大的計算能力,但其計算能力有時被閑置而沒有得到有效利用。在算法方面,某些初創公司和研究機構具有強大的模型開發能力,但因沒有足夠的數據和算力,無法優化機器學習模型。
為了解決上述技術問題中的一個或多個,本公開提出利用多個結點訓練機器學習模型來實現去中心化的數據分析。
本發明提供一種去中心化的數據分析方法,包括以下步驟:a)將用于進行數據分析的機器學習模型的模型文件發送給多個工作結點;b)從所述多個工作結點接收多個模型訓練結果,其中所述多個模型訓練結果是分別由所述多個工作結點根據所述模型文件進行模型訓練得到的;c)根據接收到的所述多個模型訓練結果,生成匯聚的模型訓練結果。
在本公開的一些實施例中,所述機器學習模型是神經網絡模型,所述模型文件包括所述神經網絡模型的多個神經元的排列信息以及賦予所述多個神經元之間的多個連接的多個參數。
在本公開的一些實施例中,數據分析方法還包括以下步驟:基于所述匯聚的模型訓練結果,更新所述模型文件;再次執行步驟a)至c)。
在本公開的一些實施例中,所述多個工作結點分別用自身的本地數據進行所述模型訓練。
在本公開的一些實施例中,數據分析方法還包括以下步驟:從應用結點接收模型請求,基于所述模型請求從模型庫中選擇所述模型文件。
在本公開的一些實施例中,數據分析方法還包括以下步驟:從應用結點接收模型請求;將所述模型請求發送給開發結點;從開發結點接收所述模型文件,其中所述模型文件是由所述開發結點基于所述模型請求生成的。
在本公開的一些實施例中,數據分析方法還包括以下步驟:基于所述模型請求,利用區塊鏈智能合約減少與應用結點對應的賬戶值并且增加與工作結點對應的賬戶值。
在本公開的一些實施例中,數據分析方法還包括以下步驟:基于所述模型請求,利用區塊鏈智能合約增加與開發結點對應的賬戶值。
在本公開的一些實施例中,數據分析方法還包括以下步驟:將所述匯聚的模型訓練結果發送給所述應用結點。
在本公開的一些實施例中,所述模型請求包括模型評價函數和測試數據集;并且數據分析方法還包括:將所述測試數據集發送給所述工作結點;從所述工作結點接收模型測試結果,其中,所述模型測試結果是由所述工作結點對所述測試數據集運行機器學習模型得到的,基于所述模型評價函數和所述模型測試結果評價所述機器學習模型。
本公開提供了一種計算機系統,包括:一個或更多個處理器;以及一個或更多個存儲器,被配置為存儲一系列計算機可執行指令,其中所述一系列計算機可執行指令在由所述一個或更多個處理器運行時使得所述一個或更多個處理器執行本公開的任意數據分析方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江省公眾信息產業有限公司,未經浙江省公眾信息產業有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811610257.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種全定點化神經網絡的設計方法
- 下一篇:一種基于大數據的故障診斷方法及系統





