[發明專利]一種小目標特征增強圖像分割方法及系統在審
| 申請號: | 202210643405.1 | 申請日: | 2022-06-08 |
| 公開(公告)號: | CN114937148A | 公開(公告)日: | 2022-08-23 |
| 發明(設計)人: | 任莎莎;張曉東 | 申請(專利權)人: | 華南理工大學 |
| 主分類號: | G06V10/26 | 分類號: | G06V10/26;G06V10/44;G06V10/80;G06V10/82;G06T7/11;G06N3/04;G06N3/08 |
| 代理公司: | 合肥市科融知識產權代理事務所(普通合伙) 34126 | 代理人: | 李慧 |
| 地址: | 510000*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 目標 特征 增強 圖像 分割 方法 系統 | ||
本發明適用于圖像處理技術領域,尤其涉及一種小目標特征增強圖像分割方法及系統,在本方法中,在圖像場景分割中存在小目標易丟失,邊緣輪廓噪聲大等問題,在目前的增強特征表征能力與優化空間細節的語義分割算法中,由于邊緣和小目標特征的丟失,導致小目標和邊緣很難被準確分割,為此,本發明提供了一種小目標特征增強的圖像分割方法:一種像素空間注意力模塊,此模塊可以獲得空間像素具有較強語義信息的特征圖像。通過對PAM的輸出與主干網絡融合,能提高圖像的小目標、邊緣分割能力,使主干網絡輸出分割精度提高。
技術領域
本發明屬于圖像處理技術領域,尤其涉及一種小目標特征增強圖像分割方法及系統。
背景技術
在場景解析中內容準確感知與理解,對于人工智能領域的計算機視覺至關重要。近年來,深度卷積神經網絡在目標識別方面取得了較大的成功。
對于諸如基于深度學習的圖像分割方法,其大多都由圖像分類領域遷移而來,未能滿足密集圖像分類或圖像分割等任務對網絡特征表征能力強度的要求。其實是對邊緣,小目標等細節語義類別關注較少。
另外,分類網絡中頻繁的池化操作與卷積步長的設置降低了空間分辨率,導致諸如交通信號等很多小目標被丟失,由于空間細節的丟失,又導致分割性能降低。
發明內容
本發明實施例的目的在于提供一種小目標特征增強圖像分割方法,旨在解決背景技術第三部分中提出的問題。
本發明實施例是這樣實現的,一種小目標特征增強圖像分割方法,所述方法包括:
將待處理圖像輸入到主干網絡中,得到主干網絡特征,所述主干網絡特征包括主干網絡第一層特征,主干網絡第二層特征,主干網絡第三層特征和主干網絡第四層特征;
將主干網絡第四層特征輸入到ASPP模塊,得到ASPP特征輸出特征;
將ASPP特征輸出特征和主干網絡第一層特征同時輸入至像素空間注意力模塊PAM,得到像素空間特征;
將像素空間特征同時輸入到小目標提取模塊TTE和邊緣特征提取模塊EEM中,分別得到小目標特征和邊緣特征;
將主干網絡第一層特征、ASPP特征輸出特征、小目標特征和邊緣特征進行融合輸出。
優選的,通過小目標實況圖對小目標特征進行監督學習,所述監督學習過程采用小目標損失函數Ltiny:
其中為像素j處的標簽分配概率分布,yj為實況圖標簽。
優選的,采用邊緣損失函數Ledge對邊緣特征進行進行監督,Ledge定義如下:
優選的,采用分割損失函數Lseg對主干網絡分割過程進行監督,分割損失函數Lseg表示為:
其中為像素j處的標簽分配概率分布,yj為GT標簽。
優選的,網絡建模中的總損失表示為:
其中,Ltotal為總損失函數,Lseg為分割損失函數,Ltiny為小目標損失函數,Ledge為邊緣損失函數,為網絡超參數,為分割損失權重系數,為小目標損失權重系數,為邊緣損失的權重系數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華南理工大學,未經華南理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210643405.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種光模塊定量上料設備
- 下一篇:激光測距單眼望遠鏡
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





