[發(fā)明專利]一種基于對抗學(xué)習(xí)的域自適應(yīng)圖像語義分割方法在審
| 申請?zhí)枺?/td> | 201811059300.1 | 申請日: | 2018-09-12 |
| 公開(公告)號: | CN109190707A | 公開(公告)日: | 2019-01-11 |
| 發(fā)明(設(shè)計)人: | 夏春秋 | 申請(專利權(quán))人: | 深圳市唯特視科技有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06K9/66;G06N3/04 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 518057 廣東省深圳市高新技術(shù)產(chǎn)業(yè)園*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 分割 對抗 自適應(yīng) 圖像語義 目標(biāo)域 圖像 局部上下文 分割空間 目標(biāo)圖像 輸出空間 網(wǎng)絡(luò)結(jié)構(gòu) 語義分割 對齊 輸出 傳遞 鑒別器 生成源 輸入源 像素級 預(yù)測源 源輸出 最大化 最小化 高維 學(xué)習(xí) 網(wǎng)絡(luò) 場景 預(yù)測 開發(fā) | ||
1.一種基于對抗學(xué)習(xí)的域自適應(yīng)圖像語義分割方法,其特征在于,主要包括領(lǐng)域適應(yīng)(一);網(wǎng)絡(luò)結(jié)構(gòu)(二);輸出空間適應(yīng)(三)。
2.基于權(quán)利要求書1所述的域自適應(yīng)圖像語義分割方法,其特征在于,首先輸入源域和目標(biāo)域圖像,傳遞到分割網(wǎng)絡(luò)以預(yù)測源域和目標(biāo)域的分割輸出;由源輸出得到的源預(yù)測生成源域的分割損失;接著將輸出作為鑒別器網(wǎng)絡(luò)的輸入,生成對抗損失,再將對抗損失傳遞到分割網(wǎng)絡(luò);最后通過最小化分割損失和最大化對抗損失,以生成滿足要求的像素級語義分割圖像。
3.基于權(quán)利要求書1所述的領(lǐng)域適應(yīng)(一),其特征在于,主要包括源域和目標(biāo)域的圖像,分別表示為Is和It,以及兩個損失函數(shù)的適應(yīng)任務(wù),分別為和其中表示適應(yīng)由目標(biāo)域的預(yù)測分割對源域的預(yù)測分割的對抗損失,表示在源域中使用真實注釋的分割損失;領(lǐng)域適應(yīng)用于解決源域與目標(biāo)域之間的域移位,注釋只包含在源域圖像中。
4.基于權(quán)利要求1所述的網(wǎng)絡(luò)結(jié)構(gòu)(二),其特征在于,主要包括分割網(wǎng)絡(luò)G和鑒別器網(wǎng)絡(luò)Di;源域和目標(biāo)域圖像經(jīng)過分割網(wǎng)絡(luò)得到特征,在輸出空間具有高度相似性,基于對抗損失,分割模型旨在欺騙鑒別器,其目的是源圖像和目標(biāo)圖像在輸出空間產(chǎn)生相似分布。
5.基于權(quán)利要求書4所述的分割網(wǎng)絡(luò),其特征在于,用于預(yù)測源域的輸出結(jié)果和目標(biāo)域的輸出結(jié)果,即源預(yù)測Ps和目標(biāo)預(yù)測Pt,經(jīng)過分割網(wǎng)絡(luò)獲得不同層次的分割特征,包括高層次特征和低層次特征,特征在輸出空間具有相似性;良好的基線模型是獲得高質(zhì)量的分割結(jié)果的前提,利用ImageNet的ReNet-101中DeepLab-v2框架作為分割基線模型,去除最后的分類層,將最后2個卷積層步幅由2改為1,Conv4和Conv5分別使用步幅為2和4的擴展卷積,添加暗黑空間金字塔池(ASPP)作為最終分類器,最后使用帶有softmax輸出的上采樣層以便匹配輸入圖像的尺寸。
6.基于權(quán)利要求書5所述的源預(yù)測Ps,其特征在于,將包含注釋的源域圖像Is傳遞到分割網(wǎng)絡(luò),以優(yōu)化分割損失并生成Ps,其中,Ps=G(Is)表示來自源域的分割預(yù)測,如下所示:
其中,表示基于源域的分割損失,w∈W、h∈H表示輸出圖像的尺寸,c∈C表示類別的數(shù)目。
7.基于權(quán)利要求書5所述的目標(biāo)預(yù)測Pt,其特征在于,在目標(biāo)預(yù)測上計算對抗損失,并將其傳播到分割網(wǎng)絡(luò)中;將目標(biāo)域圖像It傳遞到分割網(wǎng)絡(luò)生成Pt,其中Pt=G(It)表示來自目標(biāo)域的分割預(yù)測;為使目標(biāo)預(yù)測與源預(yù)測更接近,優(yōu)化對抗損失如下所示:
其中,對抗損失在于將目標(biāo)預(yù)測作為源預(yù)測的可能性最大化,以此訓(xùn)練分割網(wǎng)絡(luò)和欺騙鑒別器。
8.基于權(quán)利要求書4所述的鑒別器網(wǎng)絡(luò)Di,其特征在于,i表示在多級對抗學(xué)習(xí)中鑒別器的級別,利用所有完全卷積層保留空間信息,鑒別器網(wǎng)絡(luò)由5個卷積層組成,步幅為2,將泄露整流函數(shù)添加在前4層卷積層上,最后一層添加上采樣層以匹配輸入圖像的大小;給定分割softmax輸出P=G(I)∈RH×W×C,此時使用包含源和目標(biāo)兩個類別的交叉熵?fù)p失將P傳遞到完全卷積鑒別器D中,優(yōu)化如下所示:
其中,z為常數(shù),當(dāng)z=1時表示從目標(biāo)域中抽取樣本圖像,z=0時表示從源域中抽取樣本圖像。
9.基于權(quán)利要求1所述的輸出空間適應(yīng)(三),其特征在于,分割輸出包含豐富的信息,通過對抗學(xué)習(xí),將相似性適應(yīng)低維softmax輸出的分割預(yù)測,最小化最大化對抗學(xué)習(xí)包含單層次對抗學(xué)習(xí)和多層次對抗學(xué)習(xí)。
10.基于權(quán)利要求書9所述的多層次對抗學(xué)習(xí),其特征在于,多層次對抗網(wǎng)絡(luò)能夠在不同特征層次實現(xiàn)輸出空間的域自適應(yīng);分割輸出在每個特征空間預(yù)測,然后通過個體鑒別器進行對抗學(xué)習(xí);利用多級適應(yīng)模型,低層次特征遠離輸出,在輸出空間執(zhí)行對抗學(xué)習(xí)時不能直接適應(yīng)預(yù)測,因此在低層次特征空間附加對抗模塊,在Conv4上提取特征映射,并添加ASPP模塊作為輔助分類器,同時增加具有相同結(jié)構(gòu)的鑒別器用于對抗學(xué)習(xí);因此,基于和的領(lǐng)域適應(yīng)目標(biāo)如下所示:
其中,i表示用于預(yù)測分割輸出的級別,λadv表示權(quán)重,用于平衡分割損失和對抗損失,優(yōu)化分割模型時,必須平衡λadv。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于深圳市唯特視科技有限公司,未經(jīng)深圳市唯特視科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811059300.1/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 農(nóng)業(yè)信息對抗資源目標(biāo)規(guī)劃最優(yōu)分配方法
- 農(nóng)業(yè)信息對抗資源模糊規(guī)劃最優(yōu)分配方法
- 農(nóng)業(yè)信息對抗資源線性規(guī)劃最優(yōu)分配方法
- 基于聚類數(shù)據(jù)挖掘的對抗行為搜索算法
- 面向多種對抗圖片攻擊的協(xié)同免疫防御方法
- 一種自適應(yīng)對抗強度的對抗訓(xùn)練方法
- 對抗攻擊模型的訓(xùn)練方法及裝置
- 對抗樣本的生成方法和裝置
- 多樣本對抗擾動生成方法、裝置、存儲介質(zhì)和計算設(shè)備
- 一種無人集群協(xié)同博弈對抗的控制方法及系統(tǒng)
- 使用后向自適應(yīng)規(guī)則進行整數(shù)數(shù)據(jù)的無損自適應(yīng)Golomb/Rice編碼和解碼
- 一種自適應(yīng)軟件UML建模及其形式化驗證方法
- 媒體自適應(yīng)參數(shù)的調(diào)整方法、系統(tǒng)及相關(guān)設(shè)備
- 五自由度自適應(yīng)位姿調(diào)整平臺
- 采用自適應(yīng)機匣和自適應(yīng)風(fēng)扇的智能發(fā)動機
- 一種自適應(yīng)樹木自動涂白裝置
- 一種基于微服務(wù)的多層次自適應(yīng)方法
- 一種天然氣發(fā)動機燃氣自適應(yīng)控制方法及系統(tǒng)
- 一種中心自適應(yīng)的焊接跟蹤機頭
- 一種有砟軌道沉降自適應(yīng)式軌道系統(tǒng)





