[發明專利]目標檢測方法、裝置、設備及計算機可讀存儲介質在審
| 申請號: | 202011104694.5 | 申請日: | 2020-10-15 |
| 公開(公告)號: | CN112215171A | 公開(公告)日: | 2021-01-12 |
| 發明(設計)人: | 諸加丹 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62;G06N3/08;G06N3/04 |
| 代理公司: | 北京派特恩知識產權代理有限公司 11270 | 代理人: | 趙翠萍;張穎玲 |
| 地址: | 518057 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 目標 檢測 方法 裝置 設備 計算機 可讀 存儲 介質 | ||
1.一種目標檢測方法,其特征在于,包括:
獲取待檢測圖像,并對所述待檢測圖像進行預處理,得到預處理后的待檢測圖像;
確定錨點框的尺寸信息和神經網絡模型對應的各個特征圖層的感受野;
將所述預處理后的待檢測圖像輸入至訓練好的神經網絡模型,得到所述待檢測圖像的目標檢測結果,所述訓練好的神經網絡模型對應的各個特征圖層的所述感受野與所述錨點框的尺寸信息滿足匹配條件;
輸出所述目標檢測結果。
2.根據權利要求1中所述的目標檢測方法,其特征在于,所述確定錨點框的尺寸信息,包括:
獲取多個樣本圖像和所述多個樣本圖像的標注信息,所述標注信息至少包括標注對象對應的標注框的尺寸信息;
對多個標注框的尺寸信息進行聚類處理,得到N個錨點框的尺寸信息,N為大于1的整數。
3.根據權利要求2中所述的方法,其特征在于,確定神經網絡模型對應的各個特征圖層的感受野,包括:
獲取預設的神經網絡模型;
基于所述神經網絡模型的參數信息確定所述神經網絡模型中各個特征圖層對應的感受野大小;
所述方法還包括:
基于所述各個特征圖層對應的感受野大小和N個錨點框的尺寸信息,確定各個錨點框對應的特征圖層;
將各個錨點框分配至對應的特征圖層。
4.根據權利要求3中所述的方法,其特征在于,所述基于所述各個特征圖層對應的感受野大小和N個錨點框的尺寸信息,確定各個錨點框對應的特征圖層,包括:
基于各個特征圖層對應的感受野大小和第i個錨點框的尺寸信息,確定第i個錨點框與各個感受野大小的各個差值,i為正整數;
將各個差值中的最小差值對應的特征圖層確定為第i目標特征圖層;
確定第i目標層為第i個錨點框對應的特征圖層,并確定所述第i目標特征圖層的感受野與所述第i個錨點框的尺寸信息滿足匹配條件。
5.根據權利要求3或4所述的方法,其特征在于,所述方法還包括:
將各個樣本圖像分別輸入所述神經網絡模型,得到各個樣本圖像對應的預測結果;
利用各個樣本圖像對應的預測結果和各個樣本圖像的標注信息對所述神經網絡模型進行反向傳播訓練,以對所述神經網絡模型的參數進行調整,以得到訓練好的神經網絡模型。
6.根據權利要求1中所述的方法,其特征在于,所述獲取待檢測圖像,包括:
獲取待檢測的視頻文件;
對所述待檢測的視頻文件進行解析,得到各個視頻幀圖像;
將所述各個視頻幀圖像確定為各個待檢測圖像。
7.根據權利要求6中所述的方法,特征在于,所述方法還包括:
獲取所述各個視頻幀圖像的目標檢測結果;
基于各個視頻幀圖像的目標檢測結果,確定所述待檢測的視頻文件中目標檢測結果為包括目標對象的視頻幀圖像的圖像個數;
基于所述圖像個數確定所述待檢測的視頻文件的檢測結果,其中,當所述圖像個數大于預設的個數閾值時,確定所述待檢測的視頻文件的檢測結果為包括目標對象。
8.根據權利要求7中所述的方法,其特征在于,所述方法還包括:
當所述視頻文件的檢測結果為包括目標對象時,確定所述視頻文件為目標視頻文件;
在確定達到預設的刪除時機時,刪除所述目標視頻文件。
9.根據權利要求7中所述的方法,其特征在于,所述方法還包括:
當所述視頻文件的檢測結果為包括目標對象時,確定所述視頻文件為目標視頻文件;
在確定達到預設的推薦時機時,確定目標推薦對象;
向所述目標推薦對象推薦該目標視頻文件。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011104694.5/1.html,轉載請聲明來源鉆瓜專利網。





