[發(fā)明專利]改進(jìn)的全卷積神經(jīng)網(wǎng)絡(luò)的陶瓷材質(zhì)件序列圖像分割方法有效
| 申請?zhí)枺?/td> | 201710141353.7 | 申請日: | 2017-03-09 |
| 公開(公告)號: | CN106920243B | 公開(公告)日: | 2019-12-17 |
| 發(fā)明(設(shè)計)人: | 溫佩芝;苗淵淵;邵其林;張文新;黃文明;鄧珍榮 | 申請(專利權(quán))人: | 桂林電子科技大學(xué) |
| 主分類號: | G06T7/11 | 分類號: | G06T7/11;G06T7/194 |
| 代理公司: | 45112 桂林市華杰專利商標(biāo)事務(wù)所有限責(zé)任公司 | 代理人: | 劉梅芳 |
| 地址: | 541004 廣西*** | 國省代碼: | 廣西;45 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 改進(jìn) 卷積 神經(jīng)網(wǎng)絡(luò) 陶瓷 材質(zhì) 序列 圖像 分割 方法 | ||
1.一種改進(jìn)的全卷積神經(jīng)網(wǎng)絡(luò)的陶瓷材質(zhì)件序列圖像分割方法,包括如下步驟:
S10:對采集的原始圖像進(jìn)行手工標(biāo)注,將目標(biāo)和背景用不同的類別區(qū)分,得到訓(xùn)練標(biāo)簽(Ground Truth),采用索引模式來表示訓(xùn)練樣本的標(biāo)簽圖;
S20:構(gòu)建改進(jìn)的基于全卷積神經(jīng)網(wǎng)絡(luò)(Fully Convolutional Network)的網(wǎng)絡(luò)模型,進(jìn)行訓(xùn)練;
S30:依據(jù)梯度下降算法(Stochastic gradient descent)計算損失函數(shù)(LossFunction)和反向傳播計算損失函數(shù)(Loss Function),對網(wǎng)絡(luò)進(jìn)行訓(xùn)練學(xué)習(xí),其中
步驟S10中,所述的對采集的原始圖像進(jìn)行手工標(biāo)注的過程包括如下步驟:
S11:對采集的原始圖像(RGB彩色圖像)進(jìn)行手工標(biāo)注,將目標(biāo)物體和背景分離,并分別用不同的顏色表示;
S12:轉(zhuǎn)為索引模式,只保留兩種顏色,使得對應(yīng)的每個像素點都有明確的類別;
S13:原始圖片存儲為JPG格式,標(biāo)簽圖存儲為PNG格式圖片,顏色模式只保留兩種,并定義為標(biāo)簽圖(Ground Truth);
步驟S20中,所述的構(gòu)建改進(jìn)的基于全卷積神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)模型,進(jìn)行訓(xùn)練,具體包括如下過程:
S21:輸入層設(shè)計為直接接收J(rèn)PG、PNG三維圖像輸入的ImageData類型的數(shù)據(jù)層;
S22:利用反卷積層,將通過池化層降低的維度通過線性插值法恢復(fù)到原來的維度;
S23:線性修正單元中利用PReLu函數(shù);
S24:輸出層改進(jìn)為二分類,把上一層反卷積層的結(jié)果通過softmax函數(shù)進(jìn)行分類;
步驟S30中,所述的依據(jù)梯度下降算法計算損失函數(shù)和反向傳播計算損失函數(shù),對網(wǎng)絡(luò)進(jìn)行訓(xùn)練學(xué)習(xí),網(wǎng)絡(luò)的每一層的權(quán)重由均值為0和方差為0.01的高斯分布來初始化,具體步驟為如下:
S31:將使用的超參數(shù):批量大小(batchsize)、動量(moment)、權(quán)重衰減系數(shù)λ、初始學(xué)習(xí)率α分別設(shè)置為:4、0.9、0.005、1×10-10;
S32:定義網(wǎng)絡(luò)的訓(xùn)練學(xué)習(xí)是最小化其整體代價函數(shù),并設(shè)定有一組數(shù)量為m的訓(xùn)練樣本集{(x(l),y(l)),…,(x(m),y(m))},網(wǎng)絡(luò)整體代價函數(shù)表示為式(3):
其中,hW,b(x)是神經(jīng)網(wǎng)絡(luò)模型,Wji(l)是第l層第j單元與第l+1層第i單元之間的連接權(quán)重,b是隱藏層神經(jīng)元的偏置項;λ是一個減小權(quán)重幅度的規(guī)則化項;W代表函數(shù)J(W,b)中的形式參數(shù),即為式(3)右邊Wji(l)的簡稱;x(l)代表數(shù)組樣本中第l個數(shù)據(jù);y(l)代表數(shù)組樣本中第l個數(shù)據(jù)對應(yīng)的標(biāo)簽;x(m)代表數(shù)組樣本中第m個數(shù)據(jù);y(m)代表數(shù)組樣本中第m個數(shù)據(jù)對應(yīng)的標(biāo)簽;x(i)代表數(shù)組樣本中第i個數(shù)據(jù);y(i)代表數(shù)組樣本中第i個數(shù)據(jù)對應(yīng)的標(biāo)簽;nl-1代表第nl-1層,一般網(wǎng)絡(luò)共n1層,則nl-1層為倒數(shù)第二層;sl代表第l層神經(jīng)元的個數(shù),sl+1代表第l+1層神經(jīng)元的個數(shù);求解式(3)最小值采用注明的隨機(jī)梯度下降最優(yōu)化算法,而計算J(W,b)對W和b的偏導(dǎo)數(shù)時,使用反向傳導(dǎo)算法;
S33:批量梯度下降法中的每一次迭代都按照式(10)和式(11)對參數(shù)W和b進(jìn)行更新:
其中,α是學(xué)習(xí)速率;bi(l)表示第l+1層第i神經(jīng)單元的偏置;
S34:在訓(xùn)練學(xué)習(xí)的過程中通過觀察式(3)中的網(wǎng)絡(luò)整體代價函數(shù)值,如果在驗證集上的式(3)中的網(wǎng)絡(luò)整體代價函數(shù)值停止增加時,將學(xué)習(xí)速率α減小為原來值的十分之一,繼續(xù)訓(xùn)練,直到網(wǎng)絡(luò)收斂。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于桂林電子科技大學(xué),未經(jīng)桂林電子科技大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710141353.7/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 卷積運(yùn)算處理方法及相關(guān)產(chǎn)品
- 一種卷積神經(jīng)網(wǎng)絡(luò)的計算方法及系統(tǒng)
- 卷積運(yùn)算方法及系統(tǒng)
- 卷積運(yùn)算方法、裝置及系統(tǒng)
- 深度神經(jīng)網(wǎng)絡(luò)裁剪方法、裝置及電子設(shè)備
- 基于卷積神經(jīng)網(wǎng)絡(luò)的圖像處理方法和圖像處理裝置
- 卷積神經(jīng)網(wǎng)絡(luò)及基于卷積神經(jīng)網(wǎng)絡(luò)的圖像處理方法
- 一種圖像處理方法、裝置以及計算機(jī)存儲介質(zhì)
- 用于卷積神經(jīng)網(wǎng)絡(luò)的卷積運(yùn)算裝置
- 基于FPGA實現(xiàn)圖像識別的方法、裝置、設(shè)備及存儲介質(zhì)
- 硬件神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法、計算裝置、軟硬件協(xié)作系統(tǒng)
- 生成較大神經(jīng)網(wǎng)絡(luò)
- 神經(jīng)網(wǎng)絡(luò)的生成方法、生成裝置和電子設(shè)備
- 一種舌診方法、裝置、計算設(shè)備及計算機(jī)存儲介質(zhì)
- 學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
- 脈沖神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法及相關(guān)轉(zhuǎn)換芯片
- 圖像處理方法、裝置、可讀存儲介質(zhì)和計算機(jī)設(shè)備
- 一種適應(yīng)目標(biāo)數(shù)據(jù)集的網(wǎng)絡(luò)模型微調(diào)方法、系統(tǒng)、終端和存儲介質(zhì)
- 用于重構(gòu)人工神經(jīng)網(wǎng)絡(luò)的處理器及其操作方法、電氣設(shè)備
- 一種圖像神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的優(yōu)化方法及裝置





