[發(fā)明專利]一種基于注意力的聯(lián)合圖像與特征自適應(yīng)的語義分割方法有效
| 申請(qǐng)?zhí)枺?/td> | 202110452783.7 | 申請(qǐng)日: | 2021-04-26 |
| 公開(公告)號(hào): | CN113205096B | 公開(公告)日: | 2022-04-15 |
| 發(fā)明(設(shè)計(jì))人: | 杜博;劉菊華;鐘起煌;肖李方安 | 申請(qǐng)(專利權(quán))人: | 武漢大學(xué) |
| 主分類號(hào): | G06V10/26 | 分類號(hào): | G06V10/26;G06V10/46;G06V10/764;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 武漢科皓知識(shí)產(chǎn)權(quán)代理事務(wù)所(特殊普通合伙) 42222 | 代理人: | 王琪 |
| 地址: | 430072 湖*** | 國省代碼: | 湖北;42 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 注意力 聯(lián)合 圖像 特征 自適應(yīng) 語義 分割 方法 | ||
1.一種基于注意力的聯(lián)合圖像與特征自適應(yīng)的語義分割方法,其特征在于:構(gòu)建了一種跨模態(tài)圖像語義分割領(lǐng)域自適應(yīng)聯(lián)合框架,包括圖像自適應(yīng)器和特征自適應(yīng)器,采用圖像自適應(yīng)器和特征自適應(yīng)器分別從圖像外觀和特征空間兩方面逐步縮小源域圖像和目標(biāo)域圖像的領(lǐng)域差異,并在特征自適應(yīng)器中引入注意力模塊,使其能夠捕獲重要區(qū)域的關(guān)鍵特征,最后使用端到端的方式將圖像自適應(yīng)器與特征自適應(yīng)連接在一起,具體包括如下步驟:
步驟(1),利用圖像自適應(yīng)器對(duì)源域圖像進(jìn)行圖像風(fēng)格轉(zhuǎn)換,在不改變圖像內(nèi)容的前提下,將源域圖像轉(zhuǎn)換為與目標(biāo)域圖像外觀相似的類目標(biāo)圖像;
步驟(2),使用特征自適應(yīng)器分別在語義預(yù)測(cè)空間和圖像生成空間中對(duì)齊類目標(biāo)圖像和目標(biāo)圖像之間的特征,以提取到領(lǐng)域不變特征;
步驟(3),在特征自適應(yīng)器中引入注意力模塊,所述注意力模塊由池化層、上采樣層、卷積層和Sigmoid激活層組成;
步驟(4),使用端到端的方式將圖像自適應(yīng)器和特征自適應(yīng)器連接在一起,得到領(lǐng)域自適應(yīng)聯(lián)合框架,最終通過訓(xùn)練得到魯棒性強(qiáng)的高性能圖像分割模型。
2.如權(quán)利要求1所述的一種基于注意力的聯(lián)合圖像與特征自適應(yīng)的語義分割方法,其特征在于:所述步驟(1)中使用圖像自適應(yīng)器對(duì)源域圖像進(jìn)行圖像風(fēng)格轉(zhuǎn)換的具體實(shí)施方式如下,
11)首先,將源域圖像Xs輸入到對(duì)抗神經(jīng)網(wǎng)絡(luò)GAN的生成器GT中,以生成類目標(biāo)域圖像Xs-t,并使用對(duì)抗神經(jīng)網(wǎng)絡(luò)中與GT相對(duì)應(yīng)的判別器DT對(duì)Xs-t進(jìn)行判別,判斷該圖像是真實(shí)的目標(biāo)域圖像,還是轉(zhuǎn)換得到的類目標(biāo)域圖像,該GAN的損失函數(shù)記為具體如公式(1)所示:
其中,SD和TD分別表示源域數(shù)據(jù)集和目標(biāo)域數(shù)據(jù)集,Xt表示真實(shí)的目標(biāo)域圖像;
12)然后,將目標(biāo)域圖像Xt送入另一個(gè)生成器GS中,從而將目標(biāo)圖像Xt轉(zhuǎn)換為類原域圖像Xt-s,并使用對(duì)應(yīng)的判別器DS進(jìn)行判別,不同于過程1)中生成器GT,生成器GS由兩個(gè)單獨(dú)的網(wǎng)絡(luò)模塊組成,即GS表示為其中F和T分別表示特征提取器和特征解碼器,該過程中損失函數(shù)記為具體如公式(2)所示:
13)使用循環(huán)一致性約束對(duì)圖像轉(zhuǎn)換過程進(jìn)行指導(dǎo),具體而言,循環(huán)一致性約束分為前向一致性約束和反向一致性約束,前向一致性約束保證Xs在圖像轉(zhuǎn)換為Xs-t之后能夠通過圖像轉(zhuǎn)換重新回到Xs,即表示為:Xs→GT(Xs)=Xs-t→T(F(GT(Xs)))=Xs-t-s;同樣的,反向一致性約束能夠保證Xt在圖像轉(zhuǎn)換為Xt-s之后能夠通過圖像轉(zhuǎn)換重新回到Xt,即表示為:Xt→T(F(Xt))=Xt-s→GT(T(F(Xt)))=Xt-s-t;循環(huán)一致性約束記為具體如公式(3)所示:
其中,和分別表示前向一致性約束和反向一致性約束;‖·‖1表示L1范數(shù);
14)最后,在得到類目標(biāo)域圖像Xs-t之后,即可將其輸入到分割網(wǎng)絡(luò)中進(jìn)行訓(xùn)練,具體而言,分割網(wǎng)絡(luò)由上述過程中使用的特征提取器F和新引入的分類器C組成,可表示為隨后,使用Xs-t和其對(duì)應(yīng)的標(biāo)簽Ys即可訓(xùn)練得到圖像分割模型,該分割模型的目標(biāo)函數(shù)如公式(4)所示:
其中,CE(·)表示交叉熵?fù)p失;Dice(·)表示Dice損失;Ps-t為分割模型對(duì)Xs-t的預(yù)測(cè)結(jié)果。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于武漢大學(xué),未經(jīng)武漢大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110452783.7/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 上一篇:鋼軌探傷車防凍系統(tǒng)及鋼軌探傷車
- 下一篇:一種攝影平臺(tái)
- 基于粒子濾波視覺注意力模型的運(yùn)動(dòng)目標(biāo)檢測(cè)方法
- 一種評(píng)測(cè)注意力狀態(tài)的方法及裝置
- 注意力測(cè)評(píng)方法、系統(tǒng)及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 兒童注意力評(píng)估系統(tǒng)及其方法
- 一種注意力檢測(cè)方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種注意力識(shí)別方法和裝置
- 一種可靠的用戶注意力監(jiān)測(cè)估計(jì)表示模型
- 注意力特征圖獲取方法及裝置、目標(biāo)檢測(cè)的方法及裝置
- 基于通道增強(qiáng)的雙注意力生成對(duì)抗網(wǎng)絡(luò)及圖像生成方法
- 一種文本情感分析模型的優(yōu)化方法及裝置
- 中繼網(wǎng)絡(luò)中的聯(lián)合方法、系統(tǒng)、中繼站及移動(dòng)臺(tái)
- 中繼網(wǎng)絡(luò)中的聯(lián)合方法、系統(tǒng)、中繼站及移動(dòng)臺(tái)
- 便攜信息終端、以及便攜信息終端的控制方法
- 電法與地震同步聯(lián)合反演方法及系統(tǒng)
- 銀行聯(lián)合放款的放款方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種基于自主學(xué)習(xí)群搜索算法的聯(lián)合調(diào)度方法及系統(tǒng)
- 一種基于多目標(biāo)種群群搜索算法的聯(lián)合調(diào)度方法及系統(tǒng)
- 聯(lián)合貸款中的罰息與利息結(jié)算方法、裝置、介質(zhì)和設(shè)備
- 一種基坑支護(hù)用H型鋼構(gòu)件
- 用于云環(huán)境的語義元聯(lián)合代理
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





