[發明專利]一種基于神經網絡的目標檢測方法、裝置有效
| 申請號: | 202210036200.7 | 申請日: | 2022-01-13 |
| 公開(公告)號: | CN114067108B | 公開(公告)日: | 2022-04-19 |
| 發明(設計)人: | 張寧;楊作興;房汝明;向志宏 | 申請(專利權)人: | 深圳比特微電子科技有限公司 |
| 主分類號: | G06V10/25 | 分類號: | G06V10/25;G06V10/82;G06N3/04;G06F40/279;G10L25/30 |
| 代理公司: | 北京德琦知識產權代理有限公司 11018 | 代理人: | 謝安昆;宋志強 |
| 地址: | 518000 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 神經網絡 目標 檢測 方法 裝置 | ||
本申請公開了一種基于神經網絡的目標檢測方法,所述神經網絡對輸入數據進行目標檢測,對神經網絡卷積運算輸出結果中特征點的特征值,進行第一操作,其中,第一操作用于對特征值的組織形式進行處理,基于第一操作的結果,計算特征點的置信度;按照特征點在第一操作結果中的第一位置信息,通過所述第一操作的反向操作,得到所述特征點在卷積運算輸出結果中的第二位置信息,將特征點的置信度、以及特征點的第二位置信息輸出,得到目標檢測結果。本申請減少了檢測過程中的算力消耗。
技術領域
本發明涉及深度學習領域,特別地,涉及一種基于神經網絡的目標檢測方法、裝置。
背景技術
在機器學習和深度學習中,基于神經網絡的目標檢測有著廣泛的應用。盡管基于神經網絡的目標檢測效果好,但依賴于大量的計算量,這導致了在硬件上對算力和帶寬的消耗。
以深度學習檢測網絡中的一段式多目標檢測方法(SSD,Single Shot Multi-BoxDetector)為例。參見圖1所示,圖1為SSD神經網絡結構的一種示意圖。SSD的神經網絡結構包括基礎網絡和金字塔網絡。基礎網絡是視覺幾何組(Visual Geometry Group,VGG)例如VGG-16的前4層網絡。金字塔網絡是特征圖逐漸變小的簡單卷積網絡。SSD的檢測包括兩路,一路是特征點的置信度(confidence)計算,另一路是特征點的坐標位置的計算。
雖然置信度和坐標位置的計算共享骨干(backbone)網絡,但由于置信度和坐標位置本身特性的差異,所以相當一部分的計算是獨立的。不論是置信度的計算,還是坐標位置的計算,都需要耗費大量的算力和帶寬。
發明內容
本發明提供了一種基于神經網絡的目標檢測方法、裝置,以節省檢測過程中的算力。
本發明第一方面提供一種基于神經網絡的目標檢測方法,所述神經網絡對輸入數據進行目標檢測, 包括:
對神經網絡中卷積運算輸出結果中特征點的特征值,進行第一操作,其中,第一操作用于對特征值的組織形式進行處理,
基于第一操作的結果,計算特征點的置信度;
按照特征點在第一操作結果中的第一位置信息,通過所述第一操作的反向操作,得到所述特征點在卷積運算輸出結果中的第二位置信息,
將特征點的置信度、以及特征點的第二位置信息輸出,得到目標檢測結果。
較佳地,該方法進一步包括,
從所述特征點中挑選出置信度大于設定置信度閾值的特征點,得到第一特征點,
所述按照特征點在第一操作結果中的第一位置信息,通過所述第一操作的反向操作,得到所述特征點在卷積運算輸出結果中的第二位置信息,包括,
按照所述第一特征點在第一操作結果中的第一位置信息,通過所述第一操作的反向操作,得到所述第一特征點在卷積運算輸出結果中的第二位置信息。
較佳地,所述對神經網絡中卷積運算輸出結果中特征點的特征值,進行第一操作,包括:
將卷積運算輸出結果中特征點的特征值,進行重排操作,所述重排操作用于將高維矩陣中特征值進行維度位置交換;
將重排操作的結果,進行平鋪操作,所述平鋪操作用于將高維矩陣中每一維度的特征值分別展開為一維數組,
將平鋪操作的結果,進行合并操作,所述合并操作用于將每維數組合并。
較佳地,所述按照所述第一特征點在第一操作結果中的第一位置信息,通過所述第一操作的反向操作,得到所述第一特征點在卷積運算輸出結果中的第二位置信息,包括,
根據第一特征點在合并操作結果中的第一位置信息,確定第一特征點在平鋪操作結果中的位置信息,
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳比特微電子科技有限公司,未經深圳比特微電子科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210036200.7/2.html,轉載請聲明來源鉆瓜專利網。





