[發明專利]圖像區域建議框檢測方法、裝置、設備及存儲介質在審
| 申請號: | 202110852078.6 | 申請日: | 2021-07-27 |
| 公開(公告)號: | CN113486879A | 公開(公告)日: | 2021-10-08 |
| 發明(設計)人: | 陳欣;戴磊;劉玉宇 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06K9/20 | 分類號: | G06K9/20;G06K9/46;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京市京大律師事務所 11321 | 代理人: | 姚維 |
| 地址: | 518033 廣東省深圳市福田區福*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 圖像 區域 建議 檢測 方法 裝置 設備 存儲 介質 | ||
本發明涉及人工智能領域,公開了一種圖像區域建議框檢測方法、裝置、設備及存儲介質。該方法包括:通過原始卷積層提取目標圖像的初始特征圖;通過第一、第二、第三混合卷積層分別提取初始特征圖對應的查詢張量、近鄰張量和價值張量;采用預置自注意力機制,融合查詢張量和近鄰張量,得到注意力圖像,并對注意力圖像和價值張量進行合并處理,得到新的特征圖;計算新的特征圖對應的二值化注意力圖像,并將二值化注意力圖像映射至目標圖像,確定目標圖像中目標對象的先驗框;根據預置收縮率,對先驗框進行邊框回歸處理,得到目標圖像中目標對象的建議框。本發明融合了Anchorbase和Anchor free對建議框的檢測,降低了建議框檢測的誤差。
技術領域
本發明涉及人工智能領域,尤其涉及一種圖像區域建議框檢測方法、裝置、設備及存儲介質。
背景技術
Anchor free(無錨目標檢測方法)則更加靈活的通過置信度定位確定回歸框的位置,好處是在原來錨點框的范圍可以根據置信度的分數,出現一個或多個潛在框的可能,增加了回歸框召回率,而且不受本身屬性的(比如寬高比,大小)的限制。
但是Anchor free在遮擋情況下,遮擋周邊的置信度呈現較高的情況,即使增加了召回率,在后續的NMS(Non-Maximum Suppression,非極大值抑制)中,也會存在干擾,特別是受到遮擋特征的干擾。Anchor free上直接在寬高上進行回歸,顆粒度更大,誤差也會更大。而Anchor base(錨定目標檢測方法)在檢測圖像中的目標對象時,將目標對象限定在一個建議框里面,一個錨點限定在一個建議框,Anchor base的回歸是建立在建議框的寬高的收縮率回歸,其,顆粒度較大,誤差也較小,但是存在召回率較低的技術問題,目前還沒有嘗試將兩者進行融合的嘗試。
發明內容
本發明的主要目的在于解決現有圖像目標檢測方法存在區域建議框邊界檢測精度低的技術問題。
本發明第一方面提供了一種圖像區域建議框檢測方法,包括:獲取目標圖像,并通過預置圖像識別模型中的原始卷積層提取所述目標圖像對應的初始特征圖;通過所述圖像識別模型中的第一混合卷積層提取所述初始特征圖對應的查詢張量,通過所述圖像識別模型中的第二混合卷積層提取所述初始特征圖對應的近鄰張量,以及通過所述圖像識別模型中的第三混合卷積層提取所述初始特征圖對應的價值張量;采用預置自注意力機制,融合所述查詢張量和所述近鄰張量,得到注意力圖像,并對所述注意力圖像和所述價值張量進行合并處理,得到新的特征圖;計算所述新的特征圖對應的二值化注意力圖像,并將所述二值化注意力圖像映射至所述目標圖像,確定所述目標圖像中目標對象的先驗框;根據預置收縮率,采用所述先驗框在所述目標圖像上進行邊框回歸處理,得到所述目標圖像中目標對象的建議框。
可選的,在本發明第一方面的第一種實現方式中,所述通過所述圖像識別模型中的第一混合卷積層提取所述初始特征圖對應的查詢張量包括:通過所述圖像識別模型中的第一混合卷積層,提取所述初始特征圖對應的多個狀態特征和初始查詢張量,并從所述多個狀態特征中隨機選取至少一個第一狀態特征;初始化所述第一狀態特征,并采用預置匹配策略,篩選與初始化的狀態特征相匹配的優化動作;從所述多個狀態特征中隨機選取至少一個第二狀態特征,并采用所述優化動作,對所述第二狀態特征進行優化;根據所述第二狀態特征的優化狀態,計算所述下一個狀態特征的優化回報,并根據所述優化回報對所述初始查詢張量進行更新;直到對全部狀態特征優化完成時,將最終更新的初始查詢張量作為所述初始特征圖對應的查詢張量。
可選的,在本發明第一方面的第二種實現方式中,所述通過所述圖像識別模型中的第二混合卷積層提取所述初始特征圖對應的近鄰張量包括:通過所述圖像識別模型中的第二混合卷積層,計算所述初始特征圖與已知類別的各個預置對照特征圖的歐式距離;并根據所述歐式距離由大到小,選取預置數量的近鄰特征圖,并對各所述近鄰特征圖進行加權組合,得到所述初始特征圖對應的近鄰張量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110852078.6/2.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





