[發明專利]特征映射復用編解碼器架構網絡及快速分割方法有效
| 申請號: | 201911065906.0 | 申請日: | 2019-11-04 |
| 公開(公告)號: | CN110796205B | 公開(公告)日: | 2023-03-24 |
| 發明(設計)人: | 劉桂雄;黃堅 | 申請(專利權)人: | 華南理工大學 |
| 主分類號: | G06V10/26 | 分類號: | G06V10/26;G06V10/774;G06V10/82;G06N3/0464 |
| 代理公司: | 北京天奇智新知識產權代理有限公司 11340 | 代理人: | 陳新勝 |
| 地址: | 510640 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 特征 映射 編解碼器 架構 網絡 快速 分割 方法 | ||
1.特征映射復用編解碼器架構網絡及快速分割方法,其特征在于,所述方法包括構建兩路語義分割網絡、確定可共用關鍵層結構及逐個合并可共用關鍵層結構,得到特征映射復用編-解碼器架構網絡優化結構;具體包括以下步驟:
步驟A、訓練兩路語義分割網絡達到機器視覺應用需求,設兩路語義分割網絡為網絡A與網絡B,并設網絡A與網絡B像素準確率分別為PAA、PAB,以及總分割時間為Tseg;
步驟B、分析主干網絡可共用關鍵層結構,主干網絡ηmain關鍵層結構使特征圖分辨率降低即降采樣或特征圖數量增加即維數增加;
步驟C、分析密集預測網絡可共用關鍵層結構,密集預測網絡ηseg關鍵層結構使特征圖分辨率增大即升采樣或特征圖數量變化即維數變化;
步驟D、逐個合并可共用關鍵層結構,重新訓練不同共用層結構數量nshare的兩路語義分割網絡,得到PAA(nshare)、PAB(nshare)、Tseg(nshare);
步驟E、根據PAA(nshare)、PAB(nshare)、Tseg(nshare)綜合得到最優共用層結構數量nshare,并定為特征映射復用編-解碼器架構網絡優化結構,實現快速復雜背景語義分割應用;
所述步驟A具體包括:訓練無共用層結構的兩路語義分割網絡nshare=0達到機器視覺應用需求,得到其PAA(0)、PAB(0)、Tseg(0);若CNN層結構超參數一致,該層結構就是可共用層結構;若能夠變換特征圖的解析度或維數的關鍵層結構共用,就是共用關鍵層結構;設網絡A、網絡B相同結構數量為nshare_max,則nshare定義域為nshare=1,2...nshare_max,每個nshare取值都是一個新語義分割網絡結構。
2.如權利要求1所述的特征映射復用編解碼器架構網絡及快速分割方法,其特征在于,所述步驟B中,主干網絡為VGG、ResNet、ResNext,特征圖分辨率變化為1/1→1/2→1/4→1/8→1/16→1/32,特征圖數量變化為3→128→256→512→1024→2048的位置。
3.如權利要求1所述的特征映射復用編解碼器架構網絡及快速分割方法,其特征在于,所述步驟C中:如層結構組PPMA-PPMB、CUP-A1-CUP-B1、CUP-A2-CUP-B2、CUP-A3-CUP-B3是密集預測網絡ηseg可共用關鍵層結構,分別實現特征圖分辨率增大即升采樣或特征圖數量變化即維數變化,特征圖分辨率變化為1/32→1/32→1/16→1/8→1/4的位置。
4.如權利要求1所述的特征映射復用編解碼器架構網絡及快速分割方法,其特征在于,所述步驟D中:對于某一個語義分割網絡,共用層結構數量nshare、專用過渡層結構數量nspec之和一定,若nshare增加,則nspec減少,nshare增加PAA(nshare)、PAB(nshare)與Tseg(nshare)均降低。
5.如權利要求1所述的特征映射復用編解碼器架構網絡及快速分割方法,其特征在于,所述步驟E中:根據PAA(nshare)、PAB(nshare)、Tseg(nshare)綜合得到最優共用層結構數量nshare,就是PAA(nshare)、PAB(nshare)能夠滿足機器視覺應用需求、且nshare最大的網絡,這時具有最小的Tseg(nshare),即兩路語義分割網絡具有最快的分割速度。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華南理工大學,未經華南理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911065906.0/1.html,轉載請聲明來源鉆瓜專利網。





