[發(fā)明專利]基于并行投影方法的L1正則化核學(xué)習(xí)機(jī)的分布式訓(xùn)練方法有效
| 申請?zhí)枺?/td> | 201510293837.4 | 申請日: | 2015-06-01 |
| 公開(公告)號: | CN104954972B | 公開(公告)日: | 2019-03-29 |
| 發(fā)明(設(shè)計(jì))人: | 侯義斌;及歆榮;侯翠琴 | 申請(專利權(quán))人: | 北京工業(yè)大學(xué) |
| 主分類號: | H04W4/38 | 分類號: | H04W4/38;H04W84/18 |
| 代理公司: | 北京思海天達(dá)知識產(chǎn)權(quán)代理有限公司 11203 | 代理人: | 沈波 |
| 地址: | 100124 *** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 并行 投影 方法 l1 正則 學(xué)習(xí)機(jī) 分布式 訓(xùn)練 | ||
1.基于并行投影方法的L1正則化核學(xué)習(xí)機(jī)的分布式訓(xùn)練方法,本方法在核學(xué)習(xí)機(jī)訓(xùn)練過程中包括四個(gè)重要機(jī)制;
機(jī)制1:節(jié)點(diǎn)本地核學(xué)習(xí)機(jī)優(yōu)化問題求解方法
在節(jié)點(diǎn)本地模型與鄰居節(jié)點(diǎn)間的局部最優(yōu)模型相一致的約束下,利用并行投影方法構(gòu)建和求解基于L1正則化的KMSE的分布式訓(xùn)練優(yōu)化問題;
機(jī)制2:節(jié)點(diǎn)本地稀疏模型求解;
利用交替方向乘子方法(Alternating Direction Method of Multipliers,ADMM)對節(jié)點(diǎn)本地的L1正則化KMSE訓(xùn)練優(yōu)化問題進(jìn)行稀疏模型求解;
機(jī)制3:鄰居節(jié)點(diǎn)間的協(xié)作機(jī)制;
為求解鄰居節(jié)點(diǎn)間的局部最優(yōu)模型、加快節(jié)點(diǎn)本地模型收斂和減少節(jié)點(diǎn)間數(shù)據(jù)傳輸量,相鄰節(jié)點(diǎn)間以傳輸稀疏模型的方式進(jìn)行協(xié)作,并將接收到的稀疏模型中攜帶的樣本信息加入到本地樣本集;
機(jī)制4:節(jié)點(diǎn)模型一致性;
當(dāng)各節(jié)點(diǎn)都收斂到穩(wěn)定模型后,僅依靠相鄰節(jié)點(diǎn)間傳輸稀疏模型的方式進(jìn)行協(xié)作,使每個(gè)節(jié)點(diǎn)上都接收到網(wǎng)絡(luò)中所有其他節(jié)點(diǎn)的模型,然后各節(jié)點(diǎn)本地對所有模型進(jìn)行平均以得到一致模型;
基于機(jī)制1、機(jī)制2、機(jī)制3和機(jī)制4的L1正則化核學(xué)習(xí)機(jī)的分布式訓(xùn)練方法有五個(gè)階段,分別是:
1.節(jié)點(diǎn)本地初始化;2.節(jié)點(diǎn)本地稀疏模型求解和發(fā)送;3.節(jié)點(diǎn)接收鄰居節(jié)點(diǎn)發(fā)送過來的稀疏模型,計(jì)算局部最優(yōu)模型預(yù)測值;4.節(jié)點(diǎn)本地模型收斂條件判定;5.節(jié)點(diǎn)模型一致性;
基于并行投影的L1正則化核學(xué)習(xí)機(jī)的分布式訓(xùn)練方法,其是在以下前提條件下進(jìn)行的:
a.網(wǎng)絡(luò)中每個(gè)節(jié)點(diǎn)都有唯一的ID號;
b.網(wǎng)絡(luò)結(jié)構(gòu)穩(wěn)定且連通;
c.網(wǎng)絡(luò)中各節(jié)點(diǎn)僅與其單跳鄰居節(jié)點(diǎn)通信;
d.網(wǎng)絡(luò)中各節(jié)點(diǎn)使用相同的核函數(shù)和相同的參數(shù)值;
其特征在于:該L1正則化核學(xué)習(xí)機(jī)的分布式訓(xùn)練方法的步驟如下,
步驟1:節(jié)點(diǎn)本地初始化
步驟1.1:各節(jié)點(diǎn)初始化網(wǎng)絡(luò)規(guī)模J、鄰居節(jié)點(diǎn)集合Bj、本地訓(xùn)練樣本集合確定核函數(shù)k(xi,xj)并初始化核參數(shù)σ和正則系數(shù)λ;
其中,Bj是由節(jié)點(diǎn)j及其鄰居節(jié)點(diǎn)構(gòu)成的集合;xjn∈Rp是節(jié)點(diǎn)j的第n個(gè)訓(xùn)練樣本jn的特征向量,p為特征向量維數(shù),yjn∈Y:={1,-1}是訓(xùn)練樣本jn對應(yīng)的類別標(biāo)簽,Nj是訓(xùn)練樣本數(shù)量;k(xi,xj)中xi和xj是兩個(gè)訓(xùn)練樣本,其作用是計(jì)算兩個(gè)訓(xùn)練樣本之間的距離,核參數(shù)σ是核函數(shù)中的一個(gè)常量參數(shù),正則系數(shù)λ是L1正則項(xiàng)的一個(gè)常量參數(shù),用于調(diào)節(jié)正則項(xiàng)在整個(gè)損失中的比例;
步驟1.2:各節(jié)點(diǎn)利用y=(x-xmin)/(xmax-xmin)將本地訓(xùn)練樣本的特征信息歸一化到[0,1]區(qū)間;各節(jié)點(diǎn)為歸一后的訓(xùn)練樣本增加標(biāo)識字段node_ID和example_ID以唯一標(biāo)識每個(gè)訓(xùn)練樣本,增加發(fā)送標(biāo)識字段is_sended標(biāo)識該樣本是否已經(jīng)發(fā)送過,以避免重復(fù)發(fā)送;
其中,x為訓(xùn)練樣本的某一個(gè)特征信息,xmax和xmin分別為訓(xùn)練樣本該特征信息的最大值和最小值,y為訓(xùn)練樣本特征信息x歸一處理后的結(jié)果;
步驟2:節(jié)點(diǎn)本地稀疏模型求解和發(fā)送
步驟2.1:各節(jié)點(diǎn)在本地模型和鄰居節(jié)點(diǎn)間的局部最優(yōu)模型相一致約束下,利用并行投影方法構(gòu)建和求解基于L1正則化的KMSE的分布式訓(xùn)練優(yōu)化問題,構(gòu)建的優(yōu)化問題形式如式(1),相應(yīng)的求解迭代形式如式(2)-式(3);
在式(1)-式(3)中,fj(xjn)是節(jié)點(diǎn)j的本地模型對本地樣本的預(yù)測值,為節(jié)點(diǎn)j及其鄰居節(jié)點(diǎn)間的局部最優(yōu)模型對節(jié)點(diǎn)j上訓(xùn)練樣本xjn的預(yù)測值;式(1)和式(2)中,λ||fj||1是對本地模型的L1正則化項(xiàng),用于本地模型的稀疏求解,為節(jié)點(diǎn)本地模型和局部最優(yōu)模型相一致的并行投影形式;Num(Bj)是包括j在內(nèi)的鄰居節(jié)點(diǎn)數(shù)量;
步驟2.2:各節(jié)點(diǎn)利用核函數(shù)k(xi,xj)對本地歸一化后的訓(xùn)練樣本進(jìn)行核矩陣計(jì)算和增廣,得到增廣矩陣Kj;
步驟2.3:各節(jié)點(diǎn)利用ADMM對式(2)的優(yōu)化問題進(jìn)行稀疏模型求解,對應(yīng)的優(yōu)化問題形式如式(4),求解迭代形式如式(5)-式(7);
zjk+1:=Sλ/ρ(αjk+1+ujk) (6)
ujk+1:=ujk+αjk+1-zjk+1 (7)
在式(4)和式(5)中,Kj是本地訓(xùn)練樣本的增廣核矩陣,Yj本地訓(xùn)練樣本的類別標(biāo)簽向量,I為本地樣本量加1,即Nj+1維的單位矩陣,αj是要求解的本地訓(xùn)練樣本的權(quán)重向量,zj是利用ADMM增加的輔助向量,輔助αj求解;
在式(5)-式(7)中,ρ是約束αj-zj=0的增廣系數(shù),是一個(gè)正常數(shù),uj為約束αj-zj=0的乘子系數(shù)向量,Sλ/ρ()為軟閾值操作函數(shù),其定義如式(8),
步驟2.4:將解αjk+1中非零項(xiàng)和對應(yīng)的樣本信息提取出來作為節(jié)點(diǎn)j∈J本地的稀疏模型,如式(9)所示:
步驟2.5:節(jié)點(diǎn)整理本地稀疏模型,如果稀疏模型中訓(xùn)練樣本的is_sended字段為0,表示該樣本還沒有被發(fā)送過,此時(shí)需要將該訓(xùn)練樣本的原始特征信息保留在模型中;如果is_sended字段為1,代表該訓(xùn)練樣本的原始特征信息已經(jīng)發(fā)送過,此時(shí)只將該樣本的標(biāo)識字段信息保留在模型中;
步驟2.6:節(jié)點(diǎn)將本地整理好的稀疏模型發(fā)送給其單跳鄰居節(jié)點(diǎn)Bj;
步驟3:節(jié)點(diǎn)接收鄰居節(jié)點(diǎn)發(fā)送過來的稀疏模型,計(jì)算局部最優(yōu)模型預(yù)測值;
步驟3.1:節(jié)點(diǎn)j∈J接收鄰居節(jié)點(diǎn)發(fā)送過來的稀疏模型fik+1(xi),i∈Bj,并將每個(gè)稀疏模型中攜帶的樣本信息不重復(fù)的加入到本地訓(xùn)練樣本集;
步驟3.2:節(jié)點(diǎn)j∈J利用接收到的各稀疏模型對本地訓(xùn)練樣本進(jìn)行預(yù)測,利用并行投影方法求解局部最優(yōu)模型預(yù)測值公式,式(3),求出本地訓(xùn)練樣本的局部最優(yōu)模型預(yù)測值
步驟4:節(jié)點(diǎn)本地模型收斂條件判定
步驟4.1:節(jié)點(diǎn)本地判斷模型是否滿足收斂條件,收斂條件為節(jié)點(diǎn)本地樣本集穩(wěn)定并且節(jié)點(diǎn)前后兩次得到的模型相同;當(dāng)所有節(jié)點(diǎn)都滿足收斂條件時(shí),執(zhí)行步驟5,否則轉(zhuǎn)步驟4.2;
步驟4.2:節(jié)點(diǎn)本地按照階段2、階段3的順序進(jìn)行優(yōu)化求解;
步驟5:節(jié)點(diǎn)模型一致性
步驟5.1:節(jié)點(diǎn)j∈J將本地稀疏模型fj*(xj)發(fā)送給單跳鄰居節(jié)點(diǎn)Bj;
步驟5.2:節(jié)點(diǎn)j∈J接收鄰居節(jié)點(diǎn)發(fā)送過來的稀疏模型fi*(xi),i∈Bj,將模型保存在本地并去重處理;
步驟5.3:節(jié)點(diǎn)j∈J將新接收到的模型fi*(xi),i∈Bj轉(zhuǎn)發(fā)給單跳鄰居節(jié)點(diǎn)Bj;
步驟5.4:當(dāng)各節(jié)點(diǎn)都得到所有節(jié)點(diǎn)的稀疏模型后,利用式(10)在節(jié)點(diǎn)本地進(jìn)行平均,得到一致模型;
最終使每個(gè)節(jié)點(diǎn)得到與集中訓(xùn)練方法相當(dāng)?shù)念A(yù)測效果,并且得到比較稀疏的預(yù)測模型,更為重要的是可以顯著降低核學(xué)習(xí)機(jī)訓(xùn)練過程中的數(shù)據(jù)通信代價(jià)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京工業(yè)大學(xué),未經(jīng)北京工業(yè)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510293837.4/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
H04W 無線通信網(wǎng)絡(luò)
H04W4-00 專門適用于無線通信網(wǎng)絡(luò)的業(yè)務(wù)或設(shè)施
H04W4-02 .利用用戶或終端位置的業(yè)務(wù)
H04W4-06 .廣播選擇分發(fā);到用戶組的業(yè)務(wù);單向選呼業(yè)務(wù)
H04W4-12 .消息傳送,例如SMS[短消息業(yè)務(wù)];郵箱;通告,例如,通知用戶通信請求的狀態(tài)或進(jìn)展
H04W4-16 .與通信相關(guān)的補(bǔ)充業(yè)務(wù),例如,呼叫轉(zhuǎn)移或呼叫保持
H04W4-18 .信息格式或內(nèi)容轉(zhuǎn)換,例如,為了向用戶或終端無線傳送的目的,由網(wǎng)絡(luò)對發(fā)送或接收的信息進(jìn)行適應(yīng)修改
- 簡單網(wǎng)絡(luò)管理協(xié)議設(shè)備的數(shù)據(jù)并行采集歸并方法及系統(tǒng)
- 減少EMI的并行數(shù)據(jù)傳輸方法
- 一種多媒體數(shù)據(jù)并行處理系統(tǒng)及方法
- 一種高速并行OQPSK解調(diào)時(shí)鐘的恢復(fù)系統(tǒng)
- 一種海量地震數(shù)據(jù)并行抽道集方法
- 3G協(xié)議的turbo碼并行譯碼方法及裝置
- 并行擴(kuò)展輸入輸出的教學(xué)裝置
- 數(shù)據(jù)的并行處理
- 并行式插件機(jī)
- 一種SPI總線與并行總線的橋接方法、設(shè)備、系統(tǒng)及介質(zhì)





