[發明專利]基于區塊鏈的神經網絡訓練容器和托管訓練方法在審
| 申請號: | 202110976704.2 | 申請日: | 2021-08-24 |
| 公開(公告)號: | CN113792872A | 公開(公告)日: | 2021-12-14 |
| 發明(設計)人: | 張金琳;高航;俞學勱 | 申請(專利權)人: | 浙江數秦科技有限公司 |
| 主分類號: | G06N3/08 | 分類號: | G06N3/08;G06N3/04;G06F21/62;G06F21/64 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 311121 浙江省杭州*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 區塊 神經網絡 訓練 容器 托管 方法 | ||
本發明涉及機器學習技術領域,具體涉及一種基于區塊鏈的神經網絡訓練容器和托管訓練方法,包括模型編號、目標神經網絡模型、主模型、若干個子模型、歷史記錄集、探測模型和目標測試集,分配模型編號,接收用戶提供的神經網絡模型和測試集,將目標神經網絡模型拆分為主模型和若干個子模型,歷史記錄集記錄已輸入數據行的哈希值,探測模型判斷新數據行是否含有全部輸入字段和輸出字段,將數據行輸入子模型,將子模型的輸出作為主模型的輸入,獲得損失值和梯度值,更新目標神經網絡、主模型和子模型的權系數。本發明能夠提供足夠數據的同時保障數據原方利益和數據的隱私安全。
技術領域
本發明涉及機器學習技術領域,具體涉及一種基于區塊鏈的神經網絡訓練容器和托管訓練方法。
背景技術
人工神經網絡,是20世紀80 年代以來人工智能領域興起的研究熱點。它從信息處理角度對人腦神經元網絡進行抽象,建立某種簡單模型,按不同的連接方式組成不同的網絡。在工程與學術界也常直接簡稱為神經網絡或類神經網絡。學習是神經網絡研究的一個重要內容,它的適應性是通過學習實現的。根據環境的變化,對權值進行調整,改善系統的行為。神經網絡是一種運算模型,由大量的神經元之間相互聯接構成。每個節點代表一種特定的輸出函數,稱為激活函數。每兩個節點間的連接都代表一個對于通過該連接信號的加權值,稱之為權重,這相當于人工神經網絡的記憶。網絡的輸出則依網絡的連接方式,權重值和激勵函數的不同而不同。神經網絡模型的本質是對自然界某種算法或者函數的逼近,或者是對一種邏輯策略的表達。但神經網絡模型的擬合精準度主要由神經網絡結構以及樣本數據決定。建立合適的層數、連接結構,并使用適當的激活函數后,即完成了神經網絡的初始建立。一旦神經網絡的結構被確定,神經網絡的最終準確度就由訓練過程決定了。優質且足夠多的樣本數據,能夠使神經網絡模型獲得較好的準確度。然而,建立神經網絡模型者不一定擁有足夠的優質數據,導致神經網絡模型的應用因數據不足受到阻礙。加之受制于隱私保護,當前數據的流動嚴重不足,數據仍然主要以孤島的形式存在。進一步導致神經網絡模型應用受阻。因而需要研究如何使神經網絡模型與擁有樣本數據的數據源方之間建立能夠保護數據隱私的數據共享通道。
中國專利CN112801198A,公開日2021年5月14日,一種基于智慧城市云平臺的數據融合處理系統,包括同一系統架構下的數據采集模塊、數據存儲模塊、數據調度模塊和數據共享模塊,數據采集模塊用于采集基礎地理信息、政府部門數據信息、企業數據信息和公眾信息;數據存儲模塊將數據存儲在Highgo Database中,使用sql查詢,將實時數據采用鍵值對方式存儲在數據庫中,將視頻和圖像以文件形式存放在分布式文件系統中。其技術方案通過建立數據融合處理模型,更高效快速地處理多源數據,有利于各用戶直接查看分享。但該技術方案不能保證數據在分享時不會泄露隱私。
發明內容
本發明要解決的技術問題是:目前神經網絡模型訓練缺少數據的技術問題。提出了一種基于區塊鏈的神經網絡訓練容器和托管訓練方法。基于區塊鏈能夠在神經網絡建立者和數據源方之間建立可信的數據使用權交易,同時通過改進的托管訓練方法,能夠保證數據的隱私安全。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江數秦科技有限公司,未經浙江數秦科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110976704.2/2.html,轉載請聲明來源鉆瓜專利網。





