[發(fā)明專(zhuān)利]一種分布魯棒性對(duì)抗學(xué)習(xí)方法有效
| 申請(qǐng)?zhí)枺?/td> | 202010891222.2 | 申請(qǐng)日: | 2020-08-30 |
| 公開(kāi)(公告)號(hào): | CN112085194B | 公開(kāi)(公告)日: | 2022-12-13 |
| 發(fā)明(設(shè)計(jì))人: | 崔鵬;劉家碩 | 申請(qǐng)(專(zhuān)利權(quán))人: | 清華大學(xué) |
| 主分類(lèi)號(hào): | G06N3/08 | 分類(lèi)號(hào): | G06N3/08;G06F30/27;G06K9/62 |
| 代理公司: | 北京清亦華知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11201 | 代理人: | 廖元秋 |
| 地址: | 100084*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 分布 魯棒性 對(duì)抗 學(xué)習(xí)方法 | ||
本發(fā)明提出一種分布魯棒性對(duì)抗學(xué)習(xí)方法,屬于魯棒學(xué)習(xí)方法和對(duì)抗學(xué)習(xí)技術(shù)領(lǐng)域。該方法首先多環(huán)境訓(xùn)練數(shù)據(jù),分別建立訓(xùn)練數(shù)據(jù)的協(xié)變量集合和目標(biāo)變量集合,通過(guò)多環(huán)境訓(xùn)練數(shù)據(jù)在模型優(yōu)化的同時(shí)對(duì)協(xié)變量的相對(duì)魯棒性進(jìn)行推斷,并據(jù)此在分布魯棒學(xué)習(xí)框架下對(duì)不同協(xié)變量進(jìn)行加權(quán),來(lái)構(gòu)造更加符合實(shí)際的對(duì)抗分布集合,最終得到訓(xùn)練完畢的模型參數(shù)以及協(xié)變量權(quán)重向量。應(yīng)用時(shí),通過(guò)協(xié)變量權(quán)重區(qū)分不同協(xié)變量的相對(duì)魯棒性,輸入模型后,得到更為準(zhǔn)確的分類(lèi)結(jié)果。本發(fā)明基于實(shí)際情境中不同協(xié)變量具有不同程度魯棒性的觀察,區(qū)別對(duì)待不同協(xié)變量來(lái)構(gòu)造更加符合實(shí)際的對(duì)抗分布集合,進(jìn)行更有效的分布魯棒優(yōu)化,在圖像分類(lèi)等多種領(lǐng)域有很高的應(yīng)用價(jià)值。
技術(shù)領(lǐng)域
本發(fā)明屬于魯棒學(xué)習(xí)方法和對(duì)抗學(xué)習(xí)技術(shù)領(lǐng)域,特別提出一種分布魯棒性對(duì)抗學(xué)習(xí)方法。
背景技術(shù)
傳統(tǒng)的機(jī)器學(xué)習(xí)方法基于經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化,當(dāng)訓(xùn)練數(shù)據(jù)存在潛在的異質(zhì)性、混雜因子或分布偏移時(shí),此類(lèi)方法通常表現(xiàn)出較差的泛化性能,故在真實(shí)環(huán)境下的預(yù)測(cè)性能不穩(wěn)定。分布魯棒學(xué)習(xí)希望通過(guò)構(gòu)造對(duì)抗分布集合并優(yōu)化其中的最壞情況,來(lái)達(dá)到分布有偏情況下更好的泛化性能,但現(xiàn)有方法存在構(gòu)造的對(duì)抗分布集合過(guò)大的問(wèn)題,而其中部分分布在真實(shí)場(chǎng)景中不需要被納入考慮,在實(shí)際應(yīng)用中,特別是具有較強(qiáng)分布偏差的情況下,實(shí)際泛化效果不佳。
在真實(shí)的應(yīng)用場(chǎng)景中,例如圖像分類(lèi)任務(wù)中,代表顏色、紋理、背景的協(xié)變量相較于代表目標(biāo)物體的協(xié)變量在不同環(huán)境中變化會(huì)更加劇烈,表現(xiàn)為不同協(xié)變量魯棒性的不同,當(dāng)在實(shí)際場(chǎng)景下應(yīng)用時(shí),若應(yīng)用于訓(xùn)練數(shù)據(jù)中少見(jiàn)的場(chǎng)景時(shí),機(jī)器學(xué)習(xí)模型的分類(lèi)表現(xiàn)會(huì)受到很大影響。圖像分類(lèi)中現(xiàn)有的分布魯棒學(xué)習(xí)方法主要是對(duì)圖像進(jìn)行微小的擾動(dòng),使用擾動(dòng)后的圖像進(jìn)行訓(xùn)練,來(lái)實(shí)現(xiàn)模型對(duì)于微小擾動(dòng)下的魯棒性。由于現(xiàn)有方法并不區(qū)分對(duì)待不同的協(xié)變量,也導(dǎo)致了只能對(duì)圖像進(jìn)行微小的擾動(dòng),并假設(shè)擾動(dòng)之后圖像標(biāo)簽沒(méi)有發(fā)生變化,也導(dǎo)致只能保證微小擾動(dòng)下的魯棒性。
發(fā)明內(nèi)容
本發(fā)明的目的是為克服已有技術(shù)的不足之處,提出一種分布魯棒性對(duì)抗學(xué)習(xí)方法。本發(fā)明基于實(shí)際情境中不同協(xié)變量具有不同程度魯棒性的觀察,區(qū)別對(duì)待不同協(xié)變量來(lái)構(gòu)造更加符合實(shí)際的對(duì)抗分布集合,進(jìn)行更有效的分布魯棒優(yōu)化。
本發(fā)明提出一種分布魯棒性對(duì)抗學(xué)習(xí)方法,其特征在于,包括以下步驟:
1)獲取多環(huán)境訓(xùn)練數(shù)據(jù);
選取來(lái)自不同環(huán)境e∈ε的訓(xùn)練數(shù)據(jù)De={Xe,Ye}組成多環(huán)境訓(xùn)練數(shù)據(jù),其中ε為環(huán)境的集合,Xe為來(lái)自環(huán)境e的所有訓(xùn)練樣本的協(xié)變量組成的該環(huán)境的協(xié)變量數(shù)組,Ye為來(lái)自環(huán)境e的所有訓(xùn)練樣本的目標(biāo)變量組成的該環(huán)境的目標(biāo)變量數(shù)組;將所有環(huán)境的協(xié)變量數(shù)組組成協(xié)變量集合,將所有環(huán)境的目標(biāo)變量數(shù)組組成目標(biāo)變量集合;
2)建立模型:該模型為從協(xié)變量X的空間到目標(biāo)變量Y的映射;
3)將步驟1)得到的協(xié)變量集合中協(xié)變量的每一維權(quán)重構(gòu)成的權(quán)重向量初始化為全1的向量,即每一維協(xié)變量的相對(duì)魯棒性是相同的,并將該權(quán)重向量作為協(xié)變量當(dāng)前權(quán)重向量w;
4)利用協(xié)變量當(dāng)前權(quán)重向量w,構(gòu)造Wasserstein距離度量下的當(dāng)前對(duì)抗分布集合其中cw(z1,z2)=|w⊙(z1-z2)|2;
其中P0代表原始的訓(xùn)練數(shù)據(jù)分布,ρ為對(duì)抗分布集合的半徑,代表分布Q與初始分布P0的分布間Wasserstein距離;zi=(xi,yi)代表訓(xùn)練樣本i,其中xi為該樣本的協(xié)變量,yi為該樣本的目標(biāo)變量,i=1,2…;
5)對(duì)于當(dāng)前對(duì)抗分布集合使用分布魯棒優(yōu)化學(xué)習(xí)步驟2)建立的模型當(dāng)前參數(shù)θ:
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于清華大學(xué),未經(jīng)清華大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010891222.2/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
- 用于校準(zhǔn)移動(dòng)魯棒性優(yōu)化函數(shù)的方法和設(shè)備
- 針對(duì)射程不確定性的質(zhì)子重離子調(diào)強(qiáng)放療魯棒優(yōu)化方法
- 基于備用整定的雙層魯棒機(jī)組組合方法
- 一種交直流混聯(lián)微網(wǎng)的隨機(jī)魯棒耦合型優(yōu)化調(diào)度方法
- 一種基于多路徑的魯棒性傳輸測(cè)評(píng)方法
- 一種基于分類(lèi)不確定集的電力系統(tǒng)環(huán)境經(jīng)濟(jì)魯棒調(diào)度方法
- 一種基于參數(shù)范圍匹配的產(chǎn)品魯棒性分析方法
- 一種大規(guī)模染色陣列魯棒性驗(yàn)證方法
- 一種Geiger型索穹頂結(jié)構(gòu)魯棒性優(yōu)化系統(tǒng)
- 一種射頻功率LDMOS器件封裝級(jí)魯棒性評(píng)估方法
- 農(nóng)業(yè)信息對(duì)抗資源目標(biāo)規(guī)劃最優(yōu)分配方法
- 農(nóng)業(yè)信息對(duì)抗資源模糊規(guī)劃最優(yōu)分配方法
- 農(nóng)業(yè)信息對(duì)抗資源線性規(guī)劃最優(yōu)分配方法
- 基于聚類(lèi)數(shù)據(jù)挖掘的對(duì)抗行為搜索算法
- 面向多種對(duì)抗圖片攻擊的協(xié)同免疫防御方法
- 一種自適應(yīng)對(duì)抗強(qiáng)度的對(duì)抗訓(xùn)練方法
- 對(duì)抗攻擊模型的訓(xùn)練方法及裝置
- 對(duì)抗樣本的生成方法和裝置
- 多樣本對(duì)抗擾動(dòng)生成方法、裝置、存儲(chǔ)介質(zhì)和計(jì)算設(shè)備
- 一種無(wú)人集群協(xié)同博弈對(duì)抗的控制方法及系統(tǒng)
- 數(shù)字學(xué)習(xí)方法及執(zhí)行此數(shù)字學(xué)習(xí)方法的攜帶式電子裝置
- 一種響應(yīng)式教學(xué)設(shè)計(jì)方法及系統(tǒng)
- 一種神經(jīng)網(wǎng)絡(luò)及該神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)方法
- 一種高光譜遙感影像目標(biāo)探測(cè)方法
- 一種八維學(xué)習(xí)方法
- 一種自適應(yīng)學(xué)習(xí)特征及其張量分解式分享學(xué)習(xí)方法
- 生成模型學(xué)習(xí)方法、生成模型學(xué)習(xí)裝置及程序
- 一種高精度定位系統(tǒng)及方法
- 學(xué)習(xí)方法、管理裝置和記錄介質(zhì)
- 一種基于圖像屬性特征表述的少樣本學(xué)習(xí)方法





