[發(fā)明專利]一種深度細化的多重信息嵌套邊緣檢測方法有效
| 申請?zhí)枺?/td> | 202110746455.8 | 申請日: | 2021-07-01 |
| 公開(公告)號: | CN113538484B | 公開(公告)日: | 2022-06-10 |
| 發(fā)明(設(shè)計)人: | 林川;王蕤興;張貞光;陳永亮;謝智星;吳海晨;李福章;潘勇才;韋艷霞 | 申請(專利權(quán))人: | 廣西科技大學(xué) |
| 主分類號: | G06T7/13 | 分類號: | G06T7/13;G06K9/62;G06V10/80;G06V10/82;G06N3/04;G06N3/08 |
| 代理公司: | 長沙正奇專利事務(wù)所有限責任公司 43113 | 代理人: | 周晟 |
| 地址: | 545006 廣西*** | 國省代碼: | 廣西;45 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 深度 細化 多重 信息 嵌套 邊緣 檢測 方法 | ||
本發(fā)明旨在提供一種深度細化的多重信息嵌套邊緣檢測方法,包括以下步驟:構(gòu)建深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)具體如下:編碼網(wǎng)絡(luò)、解碼網(wǎng)絡(luò);編碼網(wǎng)絡(luò)為VGG16網(wǎng)絡(luò),該VGG16網(wǎng)絡(luò)去除了所有全連接層、pool5池化層,只保留了VGG16網(wǎng)絡(luò)主體;解碼網(wǎng)絡(luò)分為三層,第一層包括壓縮模塊、重塑模塊、調(diào)整模塊;第二層為信息提取融合模塊a、信息提取融合模塊b、信息提取融合模塊信息c、提取融合模塊d;第三層為在橫向細分輪廓網(wǎng)絡(luò)模塊。
技術(shù)領(lǐng)域
本發(fā)明涉及圖像處理領(lǐng)域,具體涉及一種深度細化的多重信息嵌套邊緣檢測方法。
背景技術(shù)
輪廓檢測是圖像處理及計算機視覺中一個很重要組成部分。從復(fù)雜的背景中正確地檢測物體輪廓是一個非常重要而困難的工作。在眾多傳統(tǒng)的圖像處理方法中,應(yīng)用于輪廓檢測較成功的有Canny算子、活動輪廓模型和基于機器學(xué)習(xí)的輪廓模型等。這些方法主要利用了圖像中的亮度,顏色,對比度信息進行檢測,難以區(qū)分目標輪廓和其他雜亂邊界。所以在面對圖像中的對比度變化比較大、背景干擾比較多的情況時,這些方法很難得到比較滿意的結(jié)果。上述算法需要相當多的領(lǐng)域?qū)I(yè)知識和精細的處理算法設(shè)計,把原始圖像數(shù)據(jù)轉(zhuǎn)換成合適的表示或者特征向量,來構(gòu)造一個輪廓分類器或者輪廓模型。近幾年來,深度學(xué)習(xí)技術(shù)已經(jīng)成為從原始數(shù)據(jù)中自動學(xué)習(xí)特征表示的高效方法。借助深度學(xué)習(xí)工具,尤其是卷積神經(jīng)網(wǎng)絡(luò),輪廓檢測任務(wù)有顯著的性能提高。
近年來,深度學(xué)習(xí)的相關(guān)研究已形成較為完整的體系。其中,HED為我們展現(xiàn)了VGG16 網(wǎng)絡(luò)五層側(cè)面圖的檢測效果,發(fā)現(xiàn)淺層的輪廓效果較差,含有大量的紋理和噪聲,傳遞過程中導(dǎo)致錯誤率上升,對實驗效果產(chǎn)生巨大影響。且現(xiàn)有深度學(xué)習(xí)算法只是將卷積層直接相加或融合,缺乏生物視覺機制的理論支撐,而仿生學(xué)算法用數(shù)學(xué)模型描述細胞響應(yīng),不足以模擬視覺機制中各層間復(fù)雜的傳遞方式。
發(fā)明內(nèi)容
本發(fā)明旨在提供一種深度細化的多重信息嵌套邊緣檢測方法,該方法克服現(xiàn)有技術(shù)缺陷,可以使輪廓更加清晰、準確。
本發(fā)明的技術(shù)方案如下:
所述的深度細化的多重信息嵌套邊緣檢測方法,包括以下步驟:
A、構(gòu)建深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),包括編碼網(wǎng)絡(luò)、解碼網(wǎng)絡(luò),具體結(jié)構(gòu)如下:
編碼網(wǎng)絡(luò)為VGG16網(wǎng)絡(luò),該VGG16網(wǎng)絡(luò)去除了所有全連接層、pool5池化層,只保留了VGG16網(wǎng)絡(luò)主體;解碼網(wǎng)絡(luò)分為三層,第一層包括壓縮模塊、重塑模塊和調(diào)整模塊;第二層為信息提取融合模塊a、信息提取融合模塊b、信息提取融合模塊信息c和信息提取融合模塊d;第三層為在橫向細分輪廓網(wǎng)絡(luò)模塊;
B、原始圖像先經(jīng)過VGG16網(wǎng)絡(luò)卷積處理,獲得VGG16的5個側(cè)面輸出圖,然后將VGG16 的5個側(cè)面輸出圖分別輸入壓縮模塊和信息提取融合模塊a;
在信息提取融合模塊a中,將第1~5側(cè)面輸出圖,經(jīng)過再次卷積處理,使得輸出通道數(shù)一致,獲得第1-5側(cè)面輸出圖的再次卷積圖像;然后第2~5側(cè)面輸出圖的再次卷積圖像分別以第1側(cè)面輸出圖再次卷積圖像為基準,統(tǒng)一分辨率,獲得2~5側(cè)面輸出圖再次卷積圖像的分辨率調(diào)整圖像,將第1側(cè)面輸出圖再次卷積圖像與2~5側(cè)面輸出圖再次卷積圖像的分辨率調(diào)整圖像融合,獲得信息提取融合圖像a,輸入橫向細分輪廓網(wǎng)絡(luò)模塊中;
C、在壓縮模塊中:對第1~5側(cè)面輸出圖像進行二次卷積,其中1、2層卷積圖像的二次卷積采用3*3卷積,3、4、5層卷積圖像的二次卷積采用1*1卷積,統(tǒng)一特征通道數(shù);將二次卷積后的1、2、3、4、5層卷積圖像,依次兩兩組合形成4個組,每組中將高分辨率的輸出圖使用最大值池化至與低分辨率輸出圖相同,然后相加,獲得四幅一次結(jié)合圖像,分別為1-2、2-3、3-4、4-5結(jié)合圖像,將該四幅圖像分別輸入重塑模塊和信息提取融合模塊b;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廣西科技大學(xué),未經(jīng)廣西科技大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110746455.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 信息記錄介質(zhì)、信息記錄方法、信息記錄設(shè)備、信息再現(xiàn)方法和信息再現(xiàn)設(shè)備
- 信息記錄裝置、信息記錄方法、信息記錄介質(zhì)、信息復(fù)制裝置和信息復(fù)制方法
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄設(shè)備、信息重放設(shè)備、信息記錄方法、信息重放方法、以及信息記錄介質(zhì)
- 信息存儲介質(zhì)、信息記錄方法、信息重放方法、信息記錄設(shè)備、以及信息重放設(shè)備
- 信息存儲介質(zhì)、信息記錄方法、信息回放方法、信息記錄設(shè)備和信息回放設(shè)備
- 信息記錄介質(zhì)、信息記錄方法、信息記錄裝置、信息再現(xiàn)方法和信息再現(xiàn)裝置
- 信息終端,信息終端的信息呈現(xiàn)方法和信息呈現(xiàn)程序
- 信息創(chuàng)建、信息發(fā)送方法及信息創(chuàng)建、信息發(fā)送裝置





