[發明專利]物體檢測方法、裝置和系統及存儲介質有效
| 申請號: | 201710740825.0 | 申請日: | 2017-08-25 |
| 公開(公告)號: | CN108875750B | 公開(公告)日: | 2021-08-10 |
| 發明(設計)人: | 王志成;俞剛 | 申請(專利權)人: | 北京曠視科技有限公司;北京邁格威科技有限公司 |
| 主分類號: | G06K9/46 | 分類號: | G06K9/46;G06K9/62 |
| 代理公司: | 北京睿邦知識產權代理事務所(普通合伙) 11481 | 代理人: | 徐丁峰;戴亞南 |
| 地址: | 100190 北京*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 物體 檢測 方法 裝置 系統 存儲 介質 | ||
本發明實施例提供一種物體檢測方法、裝置和系統及存儲介質。方法包括:獲取待檢測圖像;將待檢測圖像輸入物體檢測網絡中的場景網絡,以獲得與待檢測圖像的場景信息相關的場景特征圖;將待檢測圖像輸入物體檢測網絡中的物體網絡,以獲得與待檢測圖像的物體信息相關的物體特征圖,并確定用于指示物體特征圖中的物體位置的第一數目的物體候選區域;對于第一數目的物體候選區域中的每一個,將該物體候選區域映射到場景特征圖上,以確定與該物體候選區域對應的場景區域特征;將物體特征圖中該物體候選區域的特征與對應的場景區域特征結合;以及將結合后的特征輸入物體檢測網絡中的分類網絡,以獲得物體檢測結果。本發明可以提升物體檢測的準確率。
技術領域
本發明涉及圖像處理領域,更具體地涉及一種物體檢測方法、裝置和系統及存儲介質。
背景技術
物體檢測是計算視覺領域的一個重要問題,也有著很廣泛的應用,如:無人駕駛、機器人或安防場景中對特定物體(人或物)進行檢測的技術。目前的物體檢測方法主要是基于區域卷積神經網絡(region-based convolutional neural networks,RCNN)的改進算法以及基于單階梯形式的算法,而這些算法在訓練階段只采用用于物體檢測的數據庫(例如Pascal VOC、COCO、ImageNet-det等)進行訓練。但是在實際情境下,人識別某個物體的時候是無形中受到場景的影響的,如:一個白色的球狀物體如果出現在泳池里,結合場景信息很大幾率地會被認為是泳帽,而如果出現在排球場,則更可能會被識別為排球。目前的物體檢測方法往往通過加大感受野(reception field)來表示對場景信息的理解,而這種方式明顯是一種近似方法,離真正的場景理解有很大距離,所以無法將場景理解在物體檢測中的作用很好地發揮出來,從某種程度上影響了物體檢測準確率的提升。
發明內容
考慮到上述問題而提出了本發明。本發明提供了一種物體檢測方法、裝置和系統及存儲介質。
根據本發明一方面,提供了一種物體檢測方法。該物體檢測方法包括:獲取待檢測圖像;將待檢測圖像輸入物體檢測網絡中的場景網絡,以獲得與待檢測圖像的場景信息相關的場景特征圖;將待檢測圖像輸入物體檢測網絡中的物體網絡,以獲得與待檢測圖像的物體信息相關的物體特征圖,并確定用于指示物體特征圖中的物體位置的第一數目的物體候選區域;對于第一數目的物體候選區域中的每一個,將該物體候選區域映射到場景特征圖上,以確定與該物體候選區域對應的場景區域特征;對于第一數目的物體候選區域中的每一個,將物體特征圖中該物體候選區域的特征與對應的場景區域特征結合,以獲得結合后的特征;以及對于第一數目的物體候選區域中的每一個,將結合后的特征輸入物體檢測網絡中的分類網絡,以獲得物體檢測結果。
示例性地,對于第一數目的物體候選區域中的每一個,將該物體候選區域映射到場景特征圖上,以確定與該物體候選區域對應的場景區域特征包括:計算該物體候選區域與場景特征圖中的預劃分的場景區域中的每個場景區域的重疊度;選擇重疊度最大的場景區域作為該物體候選區域的關聯場景區域;以及從場景特征圖中提取關聯場景區域的特征作為與該物體候選區域對應的場景區域特征。
示例性地,對于第一數目的物體候選區域中的每一個,將該物體候選區域映射到場景特征圖上,以確定與該物體候選區域對應的場景區域特征包括:對該物體候選區域進行縮放,以獲得經縮放區域;確定場景特征圖中與經縮放區域位置一致的區域為該物體候選區域的關聯場景區域;以及從場景特征圖中提取關聯場景區域的特征作為與該物體候選區域對應的場景區域特征。
示例性地,對于第一數目的物體候選區域中的每一個,將結合后的特征輸入物體檢測網絡中的分類網絡,以獲得物體檢測結果包括:對于第一數目的物體候選區域中的每一個,將結合后的特征輸入分類網絡,以獲得分類網絡輸出的、第二數目的物體候選區域中的每個物體候選區域的坐標和與每個物體候選區域對應的該物體候選區域屬于每個預定類別的置信度;采用非最大值抑制算法對第二數目的物體候選區域進行過濾,以獲得第三數目的物體候選區域;以及確定第三數目的物體候選區域中的每個物體候選區域的坐標和與每個物體候選區域對應的該物體候選區域屬于每個預定類別的置信度為物體檢測結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京曠視科技有限公司;北京邁格威科技有限公司,未經北京曠視科技有限公司;北京邁格威科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710740825.0/2.html,轉載請聲明來源鉆瓜專利網。





