[發(fā)明專利]一種基于編解碼結(jié)構(gòu)的區(qū)域注意力語義分割方法及系統(tǒng)在審
| 申請?zhí)枺?/td> | 202210577112.8 | 申請日: | 2022-05-25 |
| 公開(公告)號: | CN114943839A | 公開(公告)日: | 2022-08-26 |
| 發(fā)明(設(shè)計(jì))人: | 徐勝軍;詹博涵;韓九強(qiáng);劉光輝;孟月波;呂紅強(qiáng);鐘德星 | 申請(專利權(quán))人: | 西安建筑科技大學(xué) |
| 主分類號: | G06V10/26 | 分類號: | G06V10/26;G06V10/42;G06V10/44;G06V10/80;G06V10/82;G06N3/04 |
| 代理公司: | 西安通大專利代理有限責(zé)任公司 61200 | 代理人: | 賀小停 |
| 地址: | 710055 陜*** | 國省代碼: | 陜西;61 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 解碼 結(jié)構(gòu) 區(qū)域 注意力 語義 分割 方法 系統(tǒng) | ||
本發(fā)明提供的一種基于編解碼結(jié)構(gòu)的區(qū)域注意力語義分割方法及系統(tǒng),包括以下步驟:將獲取的待分割的圖像輸入至預(yù)構(gòu)建得到的基于編解碼結(jié)構(gòu)的區(qū)域注意力網(wǎng)絡(luò)模型中,得到分割圖;其中,所述預(yù)構(gòu)建得到的基于編解碼結(jié)構(gòu)的區(qū)域注意力網(wǎng)絡(luò)模型結(jié)構(gòu)包括特征提取網(wǎng)絡(luò)、區(qū)域注意力模塊和多尺度跳接特征融合模塊;本發(fā)明方法不僅有效地解決遮擋物體誤分割問題,而且還可以提升待分割物體邊緣特征的準(zhǔn)確表達(dá),從而提高了分割精度,實(shí)現(xiàn)對物體的精準(zhǔn)分割。
技術(shù)領(lǐng)域
本發(fā)明屬于物體檢測技術(shù)領(lǐng)域,具體涉及一種基于編解碼結(jié)構(gòu)的區(qū)域注意力語義分割方法及系統(tǒng)。
背景技術(shù)
物體檢測技術(shù)作為機(jī)器人視覺系統(tǒng)的重要組成部分,其主要任務(wù)是對采集的圖像進(jìn)行處理,提取出物體所在區(qū)域和類別信息,根據(jù)這些信息控制機(jī)器人進(jìn)行抓取。因此,物體檢測技術(shù)在機(jī)器人視覺系統(tǒng)中顯得尤為重要。
在工業(yè)機(jī)器人裝配作業(yè)中,對抓取精度要求很高,抓取出現(xiàn)偏差直接導(dǎo)致裝配作業(yè)失敗。傳統(tǒng)的物體抓取方法根據(jù)圖像處理技術(shù)得到零件和背景的分割圖,再對零件的分割圖使用邊緣檢測得到零件的最小外接矩形框,通過矩形框的四個(gè)頂點(diǎn)計(jì)算出零件的抓取點(diǎn)。
傳統(tǒng)的圖像處理方法容易受環(huán)境因素的影響不能保證完整分割零件和背景,這直接導(dǎo)致根據(jù)分割圖計(jì)算出來的抓取點(diǎn)出現(xiàn)偏差,使得抓取出現(xiàn)誤差。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種基于編解碼結(jié)構(gòu)的區(qū)域注意力語義分割方法及系統(tǒng),接了現(xiàn)有的圖像處理方法存在誤差大的缺陷。
為了達(dá)到上述目的,本發(fā)明采用的技術(shù)方案是:
本發(fā)明提供的一種基于編解碼結(jié)構(gòu)的區(qū)域注意力語義分割方法,包括以下步驟:
將獲取的待分割的圖像輸入至預(yù)構(gòu)建得到的基于編解碼結(jié)構(gòu)的區(qū)域注意力網(wǎng)絡(luò)模型中,得到分割圖;其中,所述預(yù)構(gòu)建得到的基于編解碼結(jié)構(gòu)的區(qū)域注意力網(wǎng)絡(luò)模型結(jié)構(gòu)包括特征提取網(wǎng)絡(luò)、區(qū)域注意力模塊和多尺度跳接特征融合模塊。
優(yōu)選地,所述特征提取網(wǎng)絡(luò)為Resnet50網(wǎng)絡(luò)。
優(yōu)選地,所述區(qū)域注意力模塊包括多個(gè)卷積層、上采樣層和損失函數(shù),每個(gè)卷積層后都有批歸一化層BN和非線性激活函數(shù)ReLu。
優(yōu)選地,所述上采樣層使用雙線性插值;損失函數(shù)采用交并比損失。
優(yōu)選地,所述多尺度跳接特征融合模塊包括1×1卷積層和上采樣,1×1卷積層由卷積、批歸一化層BN和非線性激活函數(shù)ReLu組成。
優(yōu)選地,所述上采樣層使用雙線性插值。
優(yōu)選地,所述多尺度跳接特征融合模塊的輸出連接卷積層,所述卷積層的輸出連接上采樣層,上采樣層輸出為基于編解碼結(jié)構(gòu)的區(qū)域注意力網(wǎng)絡(luò)的分割結(jié)果。
優(yōu)選地,所述預(yù)構(gòu)建得到的基于編解碼結(jié)構(gòu)的區(qū)域注意力網(wǎng)絡(luò)模型的總損失函數(shù)為:
Loss=IoU loss+Corss loss
其中,IoU loss為交并比損失,Corss loss為交叉熵?fù)p失。
一種基于編解碼結(jié)構(gòu)的區(qū)域注意力語義分割系統(tǒng),包括:
數(shù)據(jù)預(yù)處理模塊,用于將獲取的數(shù)據(jù)集進(jìn)行預(yù)處理,得到預(yù)處理后的數(shù)據(jù)集;
網(wǎng)絡(luò)模塊,用于預(yù)構(gòu)建得到的基于編解碼結(jié)構(gòu)的區(qū)域注意力網(wǎng)絡(luò)模型;
分割模塊,用于將獲取的待分割的圖像輸入至預(yù)構(gòu)建得到的基于編解碼結(jié)構(gòu)的區(qū)域注意力網(wǎng)絡(luò)模型中,得到分割圖。
與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果是:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于西安建筑科技大學(xué),未經(jīng)西安建筑科技大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210577112.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 卡片結(jié)構(gòu)、插座結(jié)構(gòu)及其組合結(jié)構(gòu)
- 鋼結(jié)構(gòu)平臺結(jié)構(gòu)
- 鋼結(jié)構(gòu)支撐結(jié)構(gòu)
- 鋼結(jié)構(gòu)支撐結(jié)構(gòu)
- 單元結(jié)構(gòu)、結(jié)構(gòu)部件和夾層結(jié)構(gòu)
- 鋼結(jié)構(gòu)扶梯結(jié)構(gòu)
- 鋼結(jié)構(gòu)隔墻結(jié)構(gòu)
- 鋼結(jié)構(gòu)連接結(jié)構(gòu)
- 螺紋結(jié)構(gòu)、螺孔結(jié)構(gòu)、機(jī)械結(jié)構(gòu)和光學(xué)結(jié)構(gòu)
- 螺紋結(jié)構(gòu)、螺孔結(jié)構(gòu)、機(jī)械結(jié)構(gòu)和光學(xué)結(jié)構(gòu)





