[發明專利]用于分割圖像的方法、裝置、設備和計算機可讀介質有效
| 申請號: | 202010614266.0 | 申請日: | 2020-06-30 |
| 公開(公告)號: | CN111860518B | 公開(公告)日: | 2022-10-04 |
| 發明(設計)人: | 李甲;蘇金明;夏長群;吳俊杰;趙沁平 | 申請(專利權)人: | 北京航空航天大學 |
| 主分類號: | G06V10/26 | 分類號: | G06V10/26;G06V10/774;G06V10/82;G06N3/04 |
| 代理公司: | 北京唯智勤實知識產權代理事務所(普通合伙) 11557 | 代理人: | 陳佳 |
| 地址: | 100083*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 分割 圖像 方法 裝置 設備 計算機 可讀 介質 | ||
本公開的實施例公開了用于分割圖像的方法、裝置、設備和計算機可讀介質。該方法的一具體實施方式包括:將輸入圖像輸入預先訓練的通用子網絡,得到通用特征;將輸入圖像輸入預先訓練的特定任務子網絡,得到特定任務特征;基于注意力機制網絡,將該通用特征添加到該特定任務特征上,得到目標任務特征;對該特定任務特征進行解碼操作,得到融合特征;利用漸進網絡對該目標任務特征和該融合特征進行集成,得到該輸入圖像的分割圖。該實施方式實現了基于特定任務特征對圖像進行分割。
技術領域
本公開的實施例涉及計算機技術領域,具體涉及用于分割圖像的方法、裝置、設備和計算機可讀介質。
背景技術
顯著物體分割是計算機視覺的重要基礎問題,對物體識別、目標跟蹤以及圖像解析等任務具有重要意義。
已有的顯著物體分割方法有很多。傳統的方法主要考慮利用全局和局部的視覺特征對比來突出顯著物體。基于深度學習的方法主要利用深度神經網絡提取特征并利用神經網絡進行特征映射和解析從而分割出顯著對象。目前基于深度學習的圖像顯著物體顯著對象分割方法很多而且性能優越。目前的方法都是在研究常規圖像的顯著物體分割,還沒有方法研究特定任務的圖像顯著物體分割。由于特定任務圖像中存在著眾多困難的問題,導致顯著物體分割很難進行,其中最重要的問題就是缺少任務相關知識,嚴重影響方法預測。
發明內容
本公開的內容部分用于以簡要的形式介紹構思,這些構思將在后面的具體實施方式部分被詳細描述。本公開的內容部分并不旨在標識要求保護的技術方案的關鍵特征或必要特征,也不旨在用于限制所要求的保護的技術方案的范圍。
本公開的一些實施例提出了用于分割圖像的方法、裝置、設備和計算機可讀介質,來解決以上背景技術部分提到的技術問題。
第一方面,本公開的一些實施例提供了一種用于分割圖像的方法,該方法包括:將輸入圖像輸入預先訓練的通用子網絡,得到通用特征;將輸入圖像輸入預先訓練的特定任務子網絡,得到特定任務特征;基于注意力機制網絡,將上述通用特征添加到上述特定任務特征上,得到目標任務特征;對上述特定任務特征進行解碼操作,得到融合特征;利用漸進網絡對上述目標任務特征和上述融合特征進行集成,得到上述輸入圖像中的顯著物體的分割圖。
第二方面,本公開的一些實施例提供了一種用于分割圖像的裝置,裝置包括:第一生成模塊,被配置成將輸入圖像輸入預先訓練的通用子網絡,得到通用特征,其中,上述通用子網絡是利用常規數據集訓練完成的;第二生成模塊,被配置成將輸入圖像輸入預先訓練的特定任務子網絡,得到特定任務特征,其中,上述特定任務子網絡包括至少一個編碼階段;添加模塊,被配置成基于注意力機制網絡,將上述通用特征添加到上述特定任務特征上,得到目標任務特征;解碼模塊,被配置成對上述特定任務特征進行解碼操作,得到融合特征;集成模塊,被配置成利用漸進網絡對上述目標任務特征和上述融合特征進行集成,得到上述輸入圖像中的顯著物體的分割圖。
第三方面,本公開的一些實施例提供了一種電子設備,包括:一個或多個處理器;存儲裝置,其上存儲有一個或多個程序,當一個或多個程序被一個或多個處理器執行,使得一個或多個處理器實現如第一方面中任一的方法。
第四方面,本公開的一些實施例提供了一種計算機可讀介質,其上存儲有計算機程序,其中,程序被處理器執行時實現如第一方面中任一的方法。
本公開的上述各個實施例中的一個實施例具有如下有益效果:首先,將輸入圖像輸入預先訓練的通用子網絡,得到通用特征;其次,將輸入圖像輸入預先訓練的特定任務子網絡,得到特定任務特征;然后,基于注意力機制網絡,將上述通用特征添加到上述特定任務特征上,得到目標任務特征;之后,對上述特定任務特征進行解碼操作,得到融合特征;最后,利用漸進網絡對上述目標任務特征和上述融合特征進行集成,得到上述輸入圖像中的顯著物體的分割圖。該實施方式提出了基于特定任務特征對圖像進行分割。
附圖說明
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京航空航天大學,未經北京航空航天大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010614266.0/2.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





