[發明專利]一種深度學習模型訓練方法、裝置、設備及存儲介質在審
| 申請號: | 202011404833.6 | 申請日: | 2020-12-04 |
| 公開(公告)號: | CN112465048A | 公開(公告)日: | 2021-03-09 |
| 發明(設計)人: | 趙仁明 | 申請(專利權)人: | 蘇州浪潮智能科技有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N20/20 |
| 代理公司: | 北京連和連知識產權代理有限公司 11278 | 代理人: | 張濤;張元 |
| 地址: | 215100 江蘇省蘇州市吳*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 深度 學習 模型 訓練 方法 裝置 設備 存儲 介質 | ||
本發明公開了一種深度學習模型訓練方法、裝置、設備及存儲介質。方法包括:將多個訓練節點均配置為使用各自的本地樣本數據進行模型訓練,并統計每一訓練節點的訓練次數;每次訓練后獲取本節點和其它節點的訓練次數,并將本節點訓練次數與其它節點訓練次數進行比較;響應于其它節點訓練次數大于本節點訓練次數,則利用其它節點的模型參數更新本節點的模型參數,以及本節點使用更新后的模型參數和本地樣本數據進行模型訓練,并更新模型參數和訓練次數;響應于其它節點訓練次數均小于等于本節點訓練次數,則利用本節點前一次訓練更新的模型參數和本地樣本數據進行模型訓練,并更新模型參數和訓練次數。本發明的模型收斂快、訓練效率、魯棒性較佳。
技術領域
本發明屬于信息安全領域,尤其涉及一種深度學習模型訓練方法、裝置、設備及存儲介質。
背景技術
深度學習已經在現實世界中得到了廣泛的運用,例如無人駕駛汽車,收據識別,電影推薦等。深度學習需要大量的數據。對于神經網絡,訓練樣本的多少,對于AI訓練的質量影響巨大。為了提升模型的準確度,通常會使用較大量的數據樣本進行訓練。然而對于用于訓練的數據樣本的收集,往往不是很容易的事情。特別是對于一些數據隱私性較強的數據,例如醫療數據、個人金融相關的數據。例如對于一個3D的大腦MRI影像數據樣本就需要一個受過訓練的神經學專家經過一周左右的時間才可以完成收集和標記。使用少量的數據樣本,無法有效率的訓練出一個DNN模型;同時想要把這樣的數據收集匯總到一起,通常會受到倫理和政策法規的限制約束,而無法有效的實施。
圖1示出了現有的中心化深度學習訓練方式,此種方式存在一個中心服務器用于收集和匯總各個訓練基節點模型訓練產生的參數數據。中心服務器收到所有的參數之后,進行參數的平均,將平均后的新參數分發給所有的訓練節點,各訓練節點收到更新后的參數之后,更新本地模型的參數,開始下一輪的訓練。現有的中線化深度學習訓練的方式嚴重依賴中心服務器進行參數交互,導致中心服務器的壓力較大,假如中心服務器故障會影響各個節點的模型訓練;此外各個節點訓練速度不同而中心服務器需要等待全部節點完成訓練才能進行后續參數的分發,模型收斂較慢訓、練效率極低。
發明內容
有鑒于此,有必要針對以上技術問題,提供能夠消除的中心服務器通信瓶頸、使各訓練節點交互更加頻繁的一種深度學習模型訓練方法、裝置、設備及存儲介質。
根據本發明的第一方面,提供了一種深度學習模型訓練方法,所述方法包括:
將多個訓練節點均配置為使用各自的本地樣本數據進行模型訓練,并統計每一訓練節點的訓練次數;
響應于每次訓練完成,獲取本節點和其它節點的訓練次數,并將本節點訓練次數與其它節點訓練次數進行比較;
響應于其它節點訓練次數大于本節點訓練次數,則利用其它節點的模型參數更新本節點的模型參數,以及本節點使用更新后的模型參數和本地樣本數據進行模型訓練,并更新模型參數和訓練次數;
響應于其它節點訓練次數均小于等于本節點訓練次數,則利用本節點前一次訓練更新的模型參數和本地樣本數據進行模型訓練,并更新模型參數和訓練次數。
在其中一個實施例中,所述方法還包括:
將本節點訓練次數與預設迭代次數進行比較;
響應于本節點訓練次數小于預設迭代次數,則返回獲取本節點和其它節點的訓練次數,并將本節點訓練次數與其它節點訓練次數進行比較的步驟;
響應于本節點訓練次等于預設迭代次數,結束本節點的模型訓練。
在其中一個實施例中,所述獲取本節點和其它節點的訓練次數,并將本節點訓練次數與其它節點訓練次數進行比較的步驟包括:
響應于本節點完成前一次訓練,則本節點向其它節點發送訓練次數獲取請求,其中,所述訓練次數獲取請求包含本節點訓練次數;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于蘇州浪潮智能科技有限公司,未經蘇州浪潮智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011404833.6/2.html,轉載請聲明來源鉆瓜專利網。





