[發明專利]一種RGB-D圖像顯著性目標獲取的方法在審
| 申請號: | 202010070635.4 | 申請日: | 2020-01-21 |
| 公開(公告)號: | CN111242238A | 公開(公告)日: | 2020-06-05 |
| 發明(設計)人: | 叢潤民;李重儀;趙耀;鐘啟航;李心怡;王玉潔 | 申請(專利權)人: | 北京交通大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 北京市商泰律師事務所 11255 | 代理人: | 劉源 |
| 地址: | 100044 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 rgb 圖像 顯著 目標 獲取 方法 | ||
1.一種RGB-D圖像顯著性目標獲取的方法,其特征在于,包括:
基于輸入的RGB-D圖像,通過交織融合網絡中的RGB分支、深度分支分別提取RGB圖像和深度圖像的跨模態特征;
基于RGB圖像和深度圖像的跨模態特征,通過交織融合網絡中的融合分支由深到淺的逐步整合來自同一級的跨模態特征,得到具有判別力的顯著性特征;
基于顯著性特征,通過損失函數進行顯著性預測,得到顯著性結果圖。
2.根據權利要求1所述的方法,其特征在于,所述的基于輸入的RGB-D圖像,通過交織融合網絡中的RGB分支和深度分支分別提取RGB圖像和深度圖像的跨模態特征包括:
基于RGB-D圖像的RGB圖像,通過交織融合網絡的RGB分支進行特征提取,獲得深度引導的RGB-D特征;
基于RGB-D圖像的深度圖像,通過交織融合網絡的深度分支進行特征提取,獲得RGB引導的RGB-D特征;
該兩個子步驟同時執行;RGB分支和深度分支都分別包括多個特征適配層用于跨模態特征轉換;RGB分支還用于引導深度分支進行特征提取,深度分支還用于引導RGB分支進行特征提取。
3.根據權利要求2所述的方法,其特征在于,所述的基于輸入的RGB-D圖像,通過交織融合網絡中的RGB分支、深度分支分別提取RGB圖像和深度圖像的跨模態特征還包括:
基于RGB-D圖像,分別通過和
(2)進行特征提取,獲得跨模態特征,式中,表示當前RGB特征frgb和來自深度分支的引導特征gd(fd)的級聯特征,gd表示深度分支的特征適配層,fd表示同一級的對應深度特征,表示當前深度特征fd和來自RGB分支的引導特征grgb(frgb)的級聯特征,grgb表示RGB分支的特征適配層,frgb表示同一級上的對應RGB特征,{·,·}表示特征級聯操作。
4.根據權利要求1所述的方法,其特征在于,所述的基于RGB圖像和深度圖像的跨模態特征,通過交織融合網絡中的融合分支由深到淺的逐步整合來自同一級的跨模態特征,得到具有判別力的顯著性特征級包括:
基于跨模態特征,由深到淺地逐步整合來自同一級的跨模態特征,并通過深度監督方法產生三組側輸出;
基于側輸出,通過塊內殘差注意力模塊并根據跨模態特征中各區域的重要程度,對跨模態特征中各區域進行加權。
5.根據權利要求4所述的方法,其特征在于,所述的基于側輸出,通過塊內殘差注意力模塊并根據跨模態特征中各區域的重要程度,對跨模態特征中各區域進行加權包括:
通過塊內殘差注意力模塊,對同一級跨模態特征的淺層特征進行加權,使跨模態特征中各區域具有相適應的權重。
6.根據權利要求5所述的方法,其特征在于,塊內殘差注意力模塊表示為式中,finbRAM表示經過塊內殘差注意力模塊后的特征,f表示一組輸入特征,Wsp表示同一級的側輸出,和分別表示逐像素相加和相乘操作。
7.根據權利要求4所述的方法,其特征在于,所述的基于顯著性特征,通過損失函數,進行顯著性預測,得到顯著性結果圖包括:
通過損失函數,對交織融合網絡進行約束訓練;
該損失函數由交叉熵損失項和對抗損失項生成;
該交叉熵損失項表示為(4),式中,φ表示網絡需要學習的參數,Y+和Y_表示顯著性真圖Y中的正樣本和負樣本像素X表示給定的RGB-D圖像,P(·)表示像素的顯著性置信值,*={f,s1,s2,s3}分別對應最終輸出和側輸出;
該對抗損失項表示為式中,G表示生成器,D表示鑒別器,I表示輸入;
損失函數表示為:
式中,和分別表示最終輸出和側輸出的標準交叉熵損失項,表示對抗損失項,λ用于控制對抗損失項比例。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京交通大學,未經北京交通大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010070635.4/1.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





