[發(fā)明專利]基于DDPG-RAM算法的復(fù)雜光照條件下織物缺陷檢測方法有效
| 申請?zhí)枺?/td> | 201911129224.1 | 申請日: | 2019-11-18 |
| 公開(公告)號: | CN110930379B | 公開(公告)日: | 2023-04-07 |
| 發(fā)明(設(shè)計(jì))人: | 柯豐愷;劉歡平;周唯倜;趙大興;孫國棟;馮維 | 申請(專利權(quán))人: | 湖北工業(yè)大學(xué) |
| 主分類號: | G06T7/00 | 分類號: | G06T7/00;G06V10/764 |
| 代理公司: | 武漢開元知識產(chǎn)權(quán)代理有限公司 42104 | 代理人: | 王和平;張繼巍 |
| 地址: | 430068 湖*** | 國省代碼: | 湖北;42 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 ddpg ram 算法 復(fù)雜 光照 條件下 織物 缺陷 檢測 方法 | ||
1.一種基于DDPG-RAM算法的復(fù)雜光照條件下織物缺陷檢測方法,其特征在于:所述檢測方法如下:
1)采集織物缺陷圖像作為訓(xùn)練樣本;
2)對步驟1)中織物缺陷圖像進(jìn)行預(yù)處理,選用圖像增強(qiáng)算法對復(fù)雜光照條件下的織物圖像進(jìn)行圖像增強(qiáng);
3)利用步驟2)中圖像增強(qiáng)后的訓(xùn)練樣本對DDPG-RAM模型進(jìn)行訓(xùn)練,確定訓(xùn)練后的網(wǎng)絡(luò)參數(shù)
3.1)構(gòu)建DDPG-RAM模型,并隨機(jī)初始化網(wǎng)絡(luò)參數(shù);
構(gòu)建DDPG-RAM模型,結(jié)合了深度確定性策略梯度(DDPG)算法和循環(huán)注意力模型(RAM),該DDPG-RAM模型包括Glimpse網(wǎng)絡(luò),Core網(wǎng)絡(luò),Action網(wǎng)絡(luò),Actor網(wǎng)絡(luò)和Critic網(wǎng)絡(luò)五個(gè)部分,Actor網(wǎng)絡(luò)、Critic網(wǎng)絡(luò)又分別構(gòu)建了兩個(gè)結(jié)構(gòu)完全相同但參數(shù)不同的eval網(wǎng)絡(luò)和target網(wǎng)絡(luò),從而形成Actor?eval網(wǎng)絡(luò)、Actor?target網(wǎng)絡(luò)、Critic?eval網(wǎng)絡(luò)和Critictarget網(wǎng)絡(luò)共四個(gè)網(wǎng)絡(luò),其中,Actor網(wǎng)絡(luò)為行為網(wǎng)絡(luò)、Critic網(wǎng)絡(luò)為評價(jià)網(wǎng)絡(luò)、eval網(wǎng)絡(luò)為估計(jì)網(wǎng)絡(luò)和target網(wǎng)絡(luò)為目標(biāo)網(wǎng)絡(luò),Actor?eval網(wǎng)絡(luò)為行為估計(jì)網(wǎng)絡(luò)、Actor?target網(wǎng)絡(luò)為行為目標(biāo)網(wǎng)絡(luò)、Critic?eval網(wǎng)絡(luò)為評價(jià)估計(jì)網(wǎng)絡(luò)、Critic?target網(wǎng)絡(luò)為為評價(jià)目標(biāo)網(wǎng)絡(luò);然后對該RAM模型進(jìn)行隨機(jī)初始化,即隨機(jī)初始化Glimpse網(wǎng)絡(luò)、Core網(wǎng)絡(luò)、Action網(wǎng)絡(luò)、Actor?eval網(wǎng)絡(luò)、Critic?eval網(wǎng)絡(luò)的參數(shù)μ(h|θμ)、Q(h,l|θQ),以及將Actor?eval網(wǎng)絡(luò)和Critic?eval網(wǎng)絡(luò)的值賦予與之對應(yīng)的target網(wǎng)絡(luò),即θμ→θμ',θQ→θQ';
fg是Glimpse網(wǎng)絡(luò)的縮寫,代表Glimpse網(wǎng)絡(luò)參數(shù),l和x是Glimpse網(wǎng)絡(luò)的輸入?yún)?shù),l代表當(dāng)前時(shí)刻裁剪圖像的中心位置,x是被裁剪的完整圖像整體;
fh是Core網(wǎng)絡(luò)的縮寫,代表Core網(wǎng)絡(luò)參數(shù),ht-1和fg是Core網(wǎng)絡(luò)的輸入?yún)?shù),ht-1代表上一時(shí)刻Core網(wǎng)絡(luò)輸出的狀態(tài)參數(shù);
fa是Action網(wǎng)絡(luò)的縮寫,代表Action網(wǎng)絡(luò)參數(shù),ht是Action?網(wǎng)絡(luò)的輸入?yún)?shù),代表當(dāng)前時(shí)刻Action網(wǎng)絡(luò)輸出的狀態(tài)參數(shù);
μ(h|θμ)代表Actor?eval網(wǎng)絡(luò),θμ代表Actor?eval網(wǎng)絡(luò)參數(shù),h是Actor?eval網(wǎng)絡(luò)的輸入?yún)?shù),代表經(jīng)過當(dāng)前時(shí)刻ht經(jīng)過全連接處理后的參數(shù);
Q(h,l|θQ)代表Critic?eval網(wǎng)絡(luò),θQ代表Critic?eval網(wǎng)絡(luò)參數(shù);
θμ→θμ'代表將Actor?eval網(wǎng)絡(luò)的參數(shù)復(fù)制給Actor?target網(wǎng)絡(luò),
θQ→θQ’代表將Critic?eval網(wǎng)絡(luò)的參數(shù)復(fù)制給Critictarget網(wǎng)絡(luò);
3.2)經(jīng)驗(yàn)池初始化為0,大小為max_size×(2×ht_dim+2+1);
設(shè)經(jīng)驗(yàn)池為i行、j列的二維矩陣,二維矩陣中每個(gè)元素的值初始化為0,其中i為樣本容量,j為每個(gè)樣本儲存的信息數(shù)量,經(jīng)驗(yàn)池大小為j=max_size×(2×ht_dim+2+1),其中ht_dim為狀態(tài)的維度;公式中的數(shù)字2為動作的維度,公式中的數(shù)字1為用于在經(jīng)驗(yàn)池中存儲獎勵(lì)信息的預(yù)留空間;
3.3)構(gòu)造一個(gè)隨機(jī)正態(tài)分布N對注意力位置施加干擾
3.4)對DDPG-RAM模型進(jìn)行訓(xùn)練
4)利用訓(xùn)練后的DDPG-RAM算法對復(fù)雜光照條件下織物缺陷圖像進(jìn)行缺陷檢測。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于湖北工業(yè)大學(xué),未經(jīng)湖北工業(yè)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911129224.1/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 無人機(jī)通信網(wǎng)絡(luò)移動控制方法、裝置、設(shè)備及存儲介質(zhì)
- 一種基于深度確信策略梯度算法的感應(yīng)電機(jī)關(guān)鍵參數(shù)獲取方法
- 基于DDPG-RAM算法的復(fù)雜光照條件下織物缺陷檢測方法
- 基于DDPG模型的MIMO雷達(dá)正交波形的生成方法
- 一種復(fù)雜山區(qū)鐵路線路智能化生成方法
- 基于DDPG和LSTM的無地圖機(jī)器人路徑導(dǎo)航方法及系統(tǒng)
- 一種車輛列隊(duì)跟蹤控制方法、裝置及計(jì)算機(jī)可讀存儲介質(zhì)
- 基于DDPG算法和SOC恢復(fù)的儲能系統(tǒng)參與電網(wǎng)一次調(diào)頻的控制方法
- 基于監(jiān)督信號引導(dǎo)的深度強(qiáng)化學(xué)習(xí)自動駕駛汽車控制方法
- 一種面向深度強(qiáng)化學(xué)習(xí)的策略異常檢測方法和裝置





