[發(fā)明專利]一種基于并行卷積神經(jīng)網(wǎng)絡(luò)的圖像顯著性檢測方法有效
| 申請?zhí)枺?/td> | 201710253255.2 | 申請日: | 2017-04-18 |
| 公開(公告)號: | CN107169954B | 公開(公告)日: | 2020-06-19 |
| 發(fā)明(設(shè)計)人: | 王偉凝;肖純;師婷婷;趙明權(quán) | 申請(專利權(quán))人: | 華南理工大學(xué) |
| 主分類號: | G06T7/00 | 分類號: | G06T7/00;G06K9/62;G06N3/04;G06T7/11 |
| 代理公司: | 廣州市華學(xué)知識產(chǎn)權(quán)代理有限公司 44245 | 代理人: | 陳文姬 |
| 地址: | 510640 廣*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 并行 卷積 神經(jīng)網(wǎng)絡(luò) 圖像 顯著 檢測 方法 | ||
1.一種基于并行卷積神經(jīng)網(wǎng)絡(luò)的圖像顯著性檢測方法,其特征在于,包括以下步驟:
(1)設(shè)計并行卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu);所述并行卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)包括全局角度檢測模塊CNN-G和局部角度檢測模塊CNN-L;
所述全局角度檢測模塊CNN-G為單路卷積神經(jīng)網(wǎng)絡(luò);所述局部角度檢測模塊CNN-L為雙路并行卷積神經(jīng)網(wǎng)絡(luò);所述全局角度檢測模塊CNN-G和局部角度檢測模塊CNN-L通過一個全連接層實(shí)現(xiàn)并行;
(2)設(shè)計兩種網(wǎng)絡(luò)輸入圖,并針對輸入定義基于超像素的標(biāo)簽;所述針對輸入定義基于超像素的標(biāo)簽,具體為:超像素標(biāo)簽由超像素與顯著圖真實(shí)標(biāo)注的重疊率決定,若大于設(shè)定的閾值則標(biāo)簽為1,視為顯著;反之,若重疊率小于設(shè)定的閾值則標(biāo)簽為0,視為非顯著;
所述網(wǎng)絡(luò)輸入圖包括全局填充圖和局部裁剪圖;
所述全局填充圖以超像素為中心、包含原圖全部信息的填充圖,代表全局特征,作為全局角度檢測模塊CNN-G的輸入;
所述局部裁剪圖以超像素為中心、包含超像素領(lǐng)域細(xì)節(jié)信息的裁剪圖,代表局部特征,作為局部角度檢測模塊CNN-L的輸入;
(3)數(shù)據(jù)集平衡化處理與輸入預(yù)處理;
(4)模型訓(xùn)練:所述模型包括數(shù)據(jù)預(yù)處理模塊和并行卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu);
(5)對目標(biāo)圖像使用已訓(xùn)練好的模型計算顯著圖。
2.根據(jù)權(quán)利要求1所述的基于并行卷積神經(jīng)網(wǎng)絡(luò)的圖像顯著性檢測方法,其特征在于,步驟(3)所述數(shù)據(jù)集平衡化處理,具體為:
對一張圖像所取得的正樣本全部采用,并隨機(jī)選取與正樣本數(shù)量一致的負(fù)樣本;將所有樣本的規(guī)格歸一化到256*256大小。
3.根據(jù)權(quán)利要求1所述的基于并行卷積神經(jīng)網(wǎng)絡(luò)的圖像顯著性檢測方法,其特征在于,步驟(1)所述并行卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的前5層為5個卷積層;第一層卷積層有96個卷積核,大小為11*11*3;第2層有256個卷積核,大小為5*5*48;第三層卷積層有384個核,大小為3*3*256;第四層卷積層有384個核,大小為3*3*192;第5層卷積層有256個核,大小為3*3*192;前兩層和第五層卷積層的后面都接一層池化層和一層正則化層。
4.根據(jù)權(quán)利要求3所述的基于并行卷積神經(jīng)網(wǎng)絡(luò)的圖像顯著性檢測方法,其特征在于,步驟(1)所述并行卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的同層卷積層參數(shù)共享,以學(xué)習(xí)尺度不變性特征。
5.根據(jù)權(quán)利要求3所述的基于并行卷積神經(jīng)網(wǎng)絡(luò)的圖像顯著性檢測方法,其特征在于,步驟(4)中,所述并行卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練包括以下步驟:
(4-1)網(wǎng)絡(luò)參數(shù)初始化;
(4-2)設(shè)置訓(xùn)練參數(shù);
(4-3)加載訓(xùn)練數(shù)據(jù);
(4-4)迭代訓(xùn)練。
6.根據(jù)權(quán)利要求5所述的基于并行卷積神經(jīng)網(wǎng)絡(luò)的圖像顯著性檢測方法,其特征在于,步驟(4-1)所述網(wǎng)絡(luò)參數(shù)初始化,具體為:采用fine-tune策略,利用AlexNet模型的前六層網(wǎng)絡(luò)參數(shù)初始化并行卷積神經(jīng)網(wǎng)絡(luò)的前六層;全連接層的初始化設(shè)置為隨機(jī)值初始化。
7.根據(jù)權(quán)利要求5所述的基于并行卷積神經(jīng)網(wǎng)絡(luò)的圖像顯著性檢測方法,其特征在于,步驟(4-2)所述訓(xùn)練參數(shù),具體為:并行卷積神經(jīng)網(wǎng)絡(luò)的前5層的初始學(xué)習(xí)率設(shè)置為0.0001;全連接層參數(shù)的初始學(xué)習(xí)率為0.001;訓(xùn)練過程設(shè)為每8次遍歷樣本集后,學(xué)習(xí)率降低40%。
8.根據(jù)權(quán)利要求5所述的基于并行卷積神經(jīng)網(wǎng)絡(luò)的圖像顯著性檢測方法,其特征在于,步驟(4-3)所述迭代訓(xùn)練:采用隨機(jī)梯度下降算法對并行卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行迭代訓(xùn)練,每迭代1000次保存一次網(wǎng)絡(luò)參數(shù),經(jīng)過不斷迭代,取得網(wǎng)絡(luò)最優(yōu)解。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于華南理工大學(xué),未經(jīng)華南理工大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710253255.2/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種橢圓型氣體凈化濾管
- 下一篇:高效流體槽池效應(yīng)層流罩
- 卷積運(yùn)算處理方法及相關(guān)產(chǎn)品
- 一種卷積神經(jīng)網(wǎng)絡(luò)的計算方法及系統(tǒng)
- 卷積運(yùn)算方法及系統(tǒng)
- 卷積運(yùn)算方法、裝置及系統(tǒng)
- 深度神經(jīng)網(wǎng)絡(luò)裁剪方法、裝置及電子設(shè)備
- 基于卷積神經(jīng)網(wǎng)絡(luò)的圖像處理方法和圖像處理裝置
- 卷積神經(jīng)網(wǎng)絡(luò)及基于卷積神經(jīng)網(wǎng)絡(luò)的圖像處理方法
- 一種圖像處理方法、裝置以及計算機(jī)存儲介質(zhì)
- 用于卷積神經(jīng)網(wǎng)絡(luò)的卷積運(yùn)算裝置
- 基于FPGA實(shí)現(xiàn)圖像識別的方法、裝置、設(shè)備及存儲介質(zhì)
- 硬件神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法、計算裝置、軟硬件協(xié)作系統(tǒng)
- 生成較大神經(jīng)網(wǎng)絡(luò)
- 神經(jīng)網(wǎng)絡(luò)的生成方法、生成裝置和電子設(shè)備
- 一種舌診方法、裝置、計算設(shè)備及計算機(jī)存儲介質(zhì)
- 學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
- 脈沖神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法及相關(guān)轉(zhuǎn)換芯片
- 圖像處理方法、裝置、可讀存儲介質(zhì)和計算機(jī)設(shè)備
- 一種適應(yīng)目標(biāo)數(shù)據(jù)集的網(wǎng)絡(luò)模型微調(diào)方法、系統(tǒng)、終端和存儲介質(zhì)
- 用于重構(gòu)人工神經(jīng)網(wǎng)絡(luò)的處理器及其操作方法、電氣設(shè)備
- 一種圖像神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的優(yōu)化方法及裝置





