[發明專利]分布式訓練的梯度壓縮在審
| 申請號: | 202110301784.1 | 申請日: | 2021-03-22 |
| 公開(公告)號: | CN113435682A | 公開(公告)日: | 2021-09-24 |
| 發明(設計)人: | K·徐;R·戴爾蒙特 | 申請(專利權)人: | 亞馬遜技術股份有限公司 |
| 主分類號: | G06Q10/06 | 分類號: | G06Q10/06;G06N3/08;G06N3/04 |
| 代理公司: | 上海專利商標事務所有限公司 31100 | 代理人: | 錢慰民;張鑫 |
| 地址: | 美國華*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 分布式 訓練 梯度 壓縮 | ||
1.一種在分布式系統中交換壓縮漸變數據以訓練神經網絡模型的方法,該方法包括:
在分布式系統的傳輸工作節點處,計算使用神經網絡模型的一組漸變和與該神經網絡模型相關的一組權重;
在傳輸工作節點上,執行為確定閾值對漸變集進行的稀疏性分析;
在傳輸工作節點處,剪切漸變集中每個有小于閾值的值,從而導致該漸變集包括非剪切的數據元素和剪切的數據元素;
在傳輸工作節點處生成映射,該映射指示漸變集中的哪些對應于非剪切的數據元素,哪些對應于剪切的數據元素;
在傳輸工作節點處,從漸變集生成包括非剪切數據元素的壓縮數據;
將映射和壓縮數據從分布式系統的傳輸工作節點傳輸到接收工作節點;
使用映射將壓縮數據中的非剪切數據元素與剪切數據元素進行組合,在接收工作節點處生成解壓縮數據,以使解壓縮數據包括含有非剪切數據元素和剪切數據元素的漸變集;以及
在接收工作節點上,根據漸變集和在接收工作節點處收到的其他漸變,計算一個同步的漸變集。
2.權利要求1所述的方法,還包括:
在傳輸工作節點處,形成包括映射和漸變集原始長度的標頭,該原始長度對應于多個非剪切的數據元素和剪切的數據元素。
3.權利要求1所述的方法,其中的映射包括具有二進制值的位圖,而該二進制值指示未剪切數據元素和剪切數據元素的位置。
4.權利要求1所述的方法,其中每個漸變集的剪切包括將值設置為等于零,使得剪切的數據元素為零數據元素,而非剪切的數據元素為非零數據元素。
5.一種方法,包括:
在分布式系統的第一個傳輸工作節點處,計算使用神經網絡模型的一組漸變和與該神經網絡模型相關的一組權重;
剪切漸變集中每個有小于閾值的值,從而導致該漸變集包括非剪切的數據元素和剪切的數據元素;
生成映射,該映射指示漸變集中的哪些對應于非剪切的數據元素,哪些對應于剪切的數據元素;
根據來自漸變集的非剪切數據元素生成壓縮數據;以及
將映射和壓縮數據從分布式系統的第一工作節點傳輸到第二工作節點。
6.要求5所述的方法,還包括:
使用映射將壓縮數據中的非剪切數據元素與剪切數據元素進行組合,在第二個工作節點處生成解壓縮數據,以獲得包括非剪切數據元素和剪切數據元素的漸變集。
7.要求5所述的方法,還包括:
形成包括映射的標頭,其中標頭和壓縮數據從第一工作節點傳輸到第二工作節點。
8.權利要求7所述的方法,其中所述標頭還包括所述漸變集集的原始長度,所述原始長度對應于所述非剪切數據元素和所述剪切數據元素的數量。
9.權利要求5所述的方法,其中的映射包括具有二進制值的位圖,而該二進制值指示未剪切數據元素和剪切數據元素的位置。
10.權利要求5所述的方法,其中每個漸變集的剪切包括將值設置為等于零,使得剪切的數據元素為零數據元素,而非剪切的數據元素為非零數據元素。
11.權利要求5所述的方法,還包括:
對漸變集執行稀疏性分析以確定閾值。
12.權利要求11所述的方法,其中執行稀疏性分析包括:
計算漸變集的平均值;
計算漸變集的標準偏差;以及
根據平均值和標準偏差確定閾值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于亞馬遜技術股份有限公司,未經亞馬遜技術股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110301784.1/1.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





