[發(fā)明專利]模型參數(shù)發(fā)送方法、裝置、服務(wù)器及存儲介質(zhì)有效
| 申請?zhí)枺?/td> | 201810273300.5 | 申請日: | 2018-03-29 |
| 公開(公告)號: | CN108491928B | 公開(公告)日: | 2019-10-25 |
| 發(fā)明(設(shè)計)人: | 吳家祥;黃維東;黃俊洲 | 申請(專利權(quán))人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06N3/04 | 分類號: | G06N3/04 |
| 代理公司: | 北京三高永信知識產(chǎn)權(quán)代理有限責(zé)任公司 11138 | 代理人: | 劉映東 |
| 地址: | 518057 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 量化 模型參數(shù)訓(xùn)練 存儲介質(zhì) 迭代量化 量化誤差 模型參數(shù) 誤差累計 樣本集 主計算 迭代 服務(wù)器 計算模型參數(shù) 信息技術(shù)領(lǐng)域 獲取目標(biāo) 節(jié)點發(fā)送 量化處理 時間衰減 通信代價 網(wǎng)絡(luò)開銷 系數(shù)計算 更新 預(yù)設(shè) 申請 修正 傳輸 壓縮 | ||
1.一種模型參數(shù)發(fā)送方法,其特征在于,應(yīng)用于包括主計算節(jié)點和N個子計算節(jié)點的模型訓(xùn)練系統(tǒng)中,所述主計算節(jié)點與所述子計算節(jié)點之間通過網(wǎng)絡(luò)連接,所述主計算節(jié)點與所述子計算節(jié)點為具備數(shù)據(jù)計算功能的裝置,所述N為正整數(shù),所述方法包括:
所述N個子計算節(jié)點中的每個子計算節(jié)點獲取目標(biāo)模型的模型參數(shù)的初始參數(shù)值和樣本集;
所述子計算節(jié)點根據(jù)所述初始參數(shù)值和所述樣本集,計算所述模型參數(shù)的第一梯度,所述第一梯度用于指示所述模型參數(shù)的變化程度;
所述子計算節(jié)點對所述第一梯度進(jìn)行迭代量化處理得到量化后的第二梯度,所述迭代量化處理是在第t個迭代輪次中基于第t-1個迭代輪次對應(yīng)的誤差累計值所進(jìn)行的量化處理,所述誤差累計值是基于預(yù)設(shè)時間衰減系數(shù)計算得到的量化誤差的累計值,所述t為大于1的正整數(shù);
所述子計算節(jié)點向所述主計算節(jié)點發(fā)送所述量化后的第二梯度,所述量化后的第二梯度用于指示所述主計算節(jié)點根據(jù)所述量化后的第二梯度對所述初始參數(shù)值進(jìn)行更新,得到更新后的參數(shù)值。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法,還包括:
所述子計算節(jié)點在所述第t個迭代輪次時,按照如下公式對所述誤差累計值進(jìn)行更新,得到所述第t個迭代輪次對應(yīng)的誤差累計值
其中,所述是在所述第t個迭代輪次對應(yīng)的所述誤差累計值,所述α是所述預(yù)設(shè)時間衰減系數(shù),所述α∈(0,1],所述是在所述第t-1個迭代輪次對應(yīng)的所述誤差累計值,所述是在所述第t個迭代輪次中,第p個所述子計算節(jié)點上計算得到的第一梯度中的第j個分量,所述是在所述第t個迭代輪次中,第p個所述子計算節(jié)點上計算得到的第二梯度中的第j個分量。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述子計算節(jié)點對所述第一梯度進(jìn)行迭代量化處理得到量化后的第二梯度,包括:
在所述第t個迭代輪次時,根據(jù)所述第t個迭代輪次對應(yīng)的第一梯度,以及所述第t-1個迭代輪次對應(yīng)的所述誤差累計值,計算得到所述第t個迭代輪次對應(yīng)的第二梯度;
當(dāng)所述迭代輪次達(dá)到預(yù)設(shè)迭代次數(shù)時,將所述預(yù)設(shè)迭代次數(shù)所計算得到的第二梯度確定為所述量化后的第二梯度。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述在所述第t個迭代輪次時,根據(jù)所述第t個迭代輪次對應(yīng)的第一梯度,以及所述第t-1個迭代輪次對應(yīng)的所述誤差累計值,計算得到所述第t個迭代輪次對應(yīng)的第二梯度,包括:
按照如下公式計算得到所述第t個迭代輪次對應(yīng)的第二梯度:
其中,所述是在所述第t個迭代輪次中,第p個所述子計算節(jié)點上計算得到的第二梯度中的第j個分量,所述是在所述第t個迭代輪次中,第p個子計算節(jié)點上計算得到的第一梯度中的第j個分量,所述λ是加權(quán)系數(shù),所述是在所述第t-1個迭代輪次對應(yīng)的所述誤差累計值,所述s是量化函數(shù)ξs()的量化級別數(shù),所述ξs()是概率化的映射函數(shù),所述p為正整數(shù),所述λ∈(0,1),所述s為大于1的正整數(shù),所述l是區(qū)間[0,s)中的整數(shù),
5.根據(jù)權(quán)利要求1至4任一所述的方法,其特征在于,所述子計算節(jié)點根據(jù)所述初始參數(shù)值和所述樣本集,計算所述模型參數(shù)的第一梯度,包括:
按照如下公式計算得到所述模型參數(shù)的第一梯度
其中,所述是在所述第t個迭代輪次中,第p個所述子計算節(jié)點上的樣本集,所述是所述樣本集的樣本數(shù)量,所述w是所述模型參數(shù)的所述初始參數(shù)值,所述x為所述第p個所述子計算節(jié)點上的第i個樣本的特征信息,所述y為所述第p個所述子計算節(jié)點上的第i個樣本的監(jiān)督信息,所述p和i均為正整數(shù)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于騰訊科技(深圳)有限公司,未經(jīng)騰訊科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810273300.5/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 數(shù)據(jù)模型訓(xùn)練方法和裝置
- 一種模型訓(xùn)練方法、裝置、電子設(shè)備及存儲介質(zhì)
- 一種分布式訓(xùn)練中參數(shù)更新方法及裝置
- 信息處理方法、裝置及存儲介質(zhì)
- 聯(lián)邦建模方法、裝置、設(shè)備及計算機(jī)可讀存儲介質(zhì)
- 基于聯(lián)邦學(xué)習(xí)和相互學(xué)習(xí)的模型參數(shù)訓(xùn)練方法及裝置
- 基于spark的模型構(gòu)建方法、裝置、系統(tǒng)及存儲介質(zhì)
- 一種超參數(shù)確定方法、裝置、計算機(jī)設(shè)備和存儲介質(zhì)
- 數(shù)據(jù)不平衡的協(xié)同訓(xùn)練方法、裝置、電子設(shè)備及存儲介質(zhì)
- 模型訓(xùn)練方法、裝置和電子設(shè)備
- 用于接合與分離存儲介質(zhì)的裝置
- 存儲介質(zhì)陣列控制器、控制方法、設(shè)備、和存儲介質(zhì)驅(qū)動器
- 存儲介質(zhì)處理方法、系統(tǒng)及數(shù)據(jù)讀寫操作方法、系統(tǒng)
- 存儲裝置、存儲介質(zhì)以及存儲介質(zhì)的制造方法
- 數(shù)據(jù)存儲
- 存儲介質(zhì)之間的數(shù)據(jù)遷移
- 一種基于存儲系統(tǒng)的控制方法及裝置
- 自助設(shè)備及自助設(shè)備的介質(zhì)存儲裝置
- 融合存儲系統(tǒng)中的數(shù)據(jù)遷移方法和裝置
- 一種數(shù)據(jù)存儲方法、裝置及電子設(shè)備
- 基于視覺模型的迭代自適應(yīng)量化索引調(diào)制水印方法
- 一種用于數(shù)字音頻信號壓縮的快速量化方法
- 基于量化無偏廣播Gossip算法的分布式負(fù)載均衡方法
- 基于矢量量化的迭代式神經(jīng)網(wǎng)絡(luò)量化方法及系統(tǒng)
- 模型參數(shù)發(fā)送方法、裝置、服務(wù)器及存儲介質(zhì)
- 一種基于自編碼預(yù)降維的圖像檢索方法、裝置和存儲介質(zhì)
- 量化參數(shù)調(diào)整方法、裝置及相關(guān)產(chǎn)品
- 量化參數(shù)調(diào)整方法、裝置及相關(guān)產(chǎn)品
- 量化參數(shù)調(diào)整方法、裝置及相關(guān)產(chǎn)品
- 模型生成方法、裝置、電子設(shè)備及存儲介質(zhì)





