[發明專利]基于漸進收縮和循環交互網絡的顯著性目標檢測算法在審
| 申請號: | 202210413768.6 | 申請日: | 2022-04-19 |
| 公開(公告)號: | CN114863208A | 公開(公告)日: | 2022-08-05 |
| 發明(設計)人: | 夏晨星;孫延光;高修菊;段松松 | 申請(專利權)人: | 安徽理工大學 |
| 主分類號: | G06V10/774 | 分類號: | G06V10/774;G06V10/82;G06V10/80;G06V10/77;G06V10/46;G06V10/44;G06V10/42;G06N3/04;G06K9/62 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 232000 安徽*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 漸進 收縮 循環 交互 網絡 顯著 目標 檢測 算法 | ||
本發明屬于計算機視覺領域,提供了一種基于漸進收縮和循環交互網絡的顯著性目標檢測算法,包括以下步驟:1)利用預訓練好的ResNet?50網絡作為主干網絡提取初始多層次特征;2)利用多尺度上下文注意力模塊捕獲局部和全局上下文注意力信息,然后通過聚合這些信息增加初始多層次特征中的顯著性目標信息;3)利用相鄰特征收縮與交互模塊將優化后的多層次特征逐漸壓縮和交互生成高質量特征表示;4)利用降維操作和Sigmoid函數將生成的高質量表示進行降維激活預測初始顯著性圖,并利用混合損失函數訓練此模型。大量的在多個公開的數據集上的實驗數據表明了,此發明具有高效性和優越性。
技術領域:
本發明涉及計算機視覺領域,具體來說,涉及了基于漸進收縮和循環交互網絡的顯著性目標檢測算法。
背景技術:
本部分的陳述僅僅是涉及到了與本發明相關的背景技術,并不必然構成現有技術。
受人類視覺感知機制的啟發,顯著物體檢測(SOD)致力于從圖像或視頻中檢測和分割最具吸引力的物體或區域。憑借其快速高效地處理數據的能力,SOD任務被廣泛用作諸多計算機視覺任務中的預處理階段,例如圖像檢索、視覺跟蹤、風格轉換、圖像或視頻壓縮等。
早期的SOD方法通過使用手工特征(例如顏色、紋理、對比度等)預測顯著性圖。然而,由于對高級語義信息的利用不足,這些顯著性檢測方法在雜亂背景中檢測輪廓復雜的顯著目標的能力有限。近年來,全卷積網絡(FCNs)由于其高效的多層次特征提取能力,在SOD任務中表現出了強大的性能。
設計有效的模型體系結構以獲取更強大的特征表示一直是SOD任務的研究熱點。此外,如何利用不同層次特征的互補信息(即高層語義信息和底層空間細節信息)也是準確顯著性檢測的關鍵問題。特征金字塔網絡(FPN)結構是用于預測顯著性圖的一種經典的結構,它通常基于完全卷積網絡(FCNs)。典型的特征金字塔網絡結構主要包括自下而上路徑的編碼器、自上而下路徑的解碼器和一些側連接。基于特征金字塔網絡結構,人們提出了各種各樣的SOD方法,并取得了良好的性能。然而,當高層次特征的語義信息指導低層次特征時,這些語義信息會隨著網絡層數量的增加而被稀釋,因此無法有效地定位顯著對象進而生成不準確的顯著性圖。此外,大分辨率特征的集成將導致計算量過大,這將導致推理速度過慢和模型訓練困難。
發明內容
為了緩解上述問題,在此發明中,我們重新構思了特征金字塔網絡(FPN)結構,并提出了漸進收縮和循環交互網絡(稱為GSCINet),以實現準確高效的顯著目標檢測任務。該方法由兩部分組成,即多尺度上下文注意模塊(MSCAM)和相鄰特征收縮與交互模塊(AFSIM)。與經典的FPN結構不同,GSCINet方法旨在通過逐步聚合和收縮相鄰特征以及循環交互策略,減少計算量,增加不同層次上的不同信息交互。更具體地說,我們首先使用MSCAM,通過使用輕量級卷積和不同尺度的通道注意矩陣,同時捕獲局部和全局上下文注意信息,這有助于有效地學習更具辨別力的重要特征。隨后,采用AFSIM逐步聚合相鄰特征,并在循環結構中迭代交互不同級別特征的互補信息,以生成高質量的特征表示。最后,我們以端到端的方式對整個網絡進行訓練,與11種最先進的SOD方法相比,取得了更好的預測顯著性圖性能。
本發明的技術方案是提供了一種基于漸進收縮和循環交互網絡的顯著性目標檢測算法,該方法包括以下步驟:
1.輸入RGB圖像,利用預訓練好的ResNet-50網絡作為主干網絡提取初始多層次特征;
1.1)收集顯著性目標檢測領域相關數據集,包括DUTS-TR數據集,DUT-OMRON數據集,HKU-IS數據集,PASCAL-S數據集和ECSSD數據集。
1.2)此發明,利用具有10553張圖像的DUTS數據集作為訓練數據集,用于訓練模型;利用DUTS-TE,DUT-OMRON,HKU-IS,PASCAL-S和ECSSD數據集作為測試數據集,用于檢測模型泛化性能。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于安徽理工大學,未經安徽理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210413768.6/2.html,轉載請聲明來源鉆瓜專利網。





