[發明專利]一種目標檢測方法、裝置、機器可讀介質及設備在審
| 申請號: | 202011107508.3 | 申請日: | 2020-10-16 |
| 公開(公告)號: | CN112200187A | 公開(公告)日: | 2021-01-08 |
| 發明(設計)人: | 姚志強;周曦;於景瞵;張愈其;鐘南昌 | 申請(專利權)人: | 廣州云從凱風科技有限公司 |
| 主分類號: | G06K9/32 | 分類號: | G06K9/32;G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 上海光華專利事務所(普通合伙) 31219 | 代理人: | 代玲 |
| 地址: | 511458 廣東省廣州市南*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 目標 檢測 方法 裝置 機器 可讀 介質 設備 | ||
本發明公開了一種目標檢測方法,包括:獲取待檢測圖像;將所述待檢測圖像輸入至預先訓練得到的基于輕量級卷積神經網絡的目標檢測模型,得到一個或多個目標檢測框以及每個目標檢測框對應的置信度;所述目標檢測框用以標識待檢測圖像中檢測到的一個或多個偽目標對象;確定置信度大于置信度閾值的目標檢測框;根據置信度大于置信度閾值的目標檢測框,確定所述待檢測圖像中的目標對象。本發明利用參數量、計算量較小的基于輕量級卷積神經網絡的目標檢測模型對待檢測圖像進行目標檢測,減小了目標檢測的計算量,提升了目標檢測的速度。
技術領域
本發明涉及目標檢測領域,具體涉及一種目標檢測方法、裝置、機器可讀介質及設備。
背景技術
由于場景的多樣性和復雜性,現有的主流目標檢測算法包括單階段SSD、YOLO和雙階段FasterRcnn算法,這些方法大都采用較大的骨干網絡來提取復雜和多樣性的場景特征,導致整體模型較大,算法推理耗時長且后處理耗時較長,不適用于要求快速響應的實際視頻監控場景。另外,實際場景中的多樣性和復雜性都會給目標檢測帶來難度。
發明內容
鑒于以上所述現有技術的缺點,本發明的目的在于提供一種目標檢測方法、裝置、機器可讀介質及設備,用于解決現有技術存在的問題。
為實現上述目的及其他相關目的,本發明提供一種目標檢測方法,包括:
獲取待檢測圖像;
將所述待檢測圖像輸入至預先訓練得到的基于輕量級卷積神經網絡的目標檢測模型,得到一個或多個目標檢測框以及每個目標檢測框對應的置信度;所述目標檢測框用以標識待檢測圖像中檢測到的一個或多個偽目標對象;
確定置信度大于置信度閾值的目標檢測框;
根據置信度大于置信度閾值的目標檢測框,確定所述待檢測圖像中的目標對象。
可選地,在訓練得到基于輕量級卷積神經網絡的目標檢測模型的過程中,通過數據增強對訓練數據進行增強,對數據進行增強的方法包括:高斯模糊、運動模糊、隨機擦除、隨機填充。
可選地,在訓練得到基于輕量級卷積神經網絡的目標檢測模型的過程中,通過基于難樣本挖掘的訓練樣本訓練得到目標數模型。
可選地,該方法還包括:將目標檢測模型的權重數據類型轉化為fp16或int8的數據類型。
可選地,所述目標檢測模型包括:
骨干網絡,用于對所述待檢測圖像進行特征提取;
頸部網絡,用于對骨干網絡提取的特征進行特征融合,得到多尺度的融合特征;
頭部網絡,用于根據多尺度的融合特征進行分類和回歸,輸出目標檢測框的坐標以及與所述目標檢測框對應的置信度。
可選地,所述骨干網包括ResNet、VGG或MobileNet;所述頭部網包括全連接網絡或1x1卷積網絡。
可選地,在將待檢測圖像輸入至目標檢測模型前,還包括對所述待檢測圖像進行預處理,所述預處理包括:圖像縮放、轉置以及圖像類型轉換。
為實現上述目的及其他相關目的,本發明還提供一種目標檢測裝置,包括:
圖像獲取模塊,用于獲取待檢測圖像;
目標檢測模塊,用于將所述待檢測圖像輸入至預先訓練得到的基于輕量級卷積神經網絡的目標檢測模型,得到一個或多個目標檢測框以及每個目標檢測框對應的置信度;所述目標檢測框用以標識待檢測圖像中檢測到的一個或多個偽目標對象;
目標檢測框確定模塊,用于確定置信度大于置信度閾值的目標檢測框;
目標對象確定模塊,用于根據置信度大于置信度閾值的目標檢測框,確定所述待檢測圖像中的目標對象。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州云從凱風科技有限公司,未經廣州云從凱風科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011107508.3/2.html,轉載請聲明來源鉆瓜專利網。





