[發明專利]提升檢測神經網絡目標檢測性能的方法及裝置有效
| 申請號: | 202010835666.4 | 申請日: | 2020-08-18 |
| 公開(公告)號: | CN112084886B | 公開(公告)日: | 2022-03-15 |
| 發明(設計)人: | 韋虎;涂治國 | 申請(專利權)人: | 眸芯科技(上海)有限公司 |
| 主分類號: | G06V40/16 | 分類號: | G06V40/16;G06V10/26;G06V10/82;G06N3/04;G06N3/08 |
| 代理公司: | 上海圖靈知識產權代理事務所(普通合伙) 31393 | 代理人: | 謝微 |
| 地址: | 201210 上海*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 提升 檢測 神經網絡 目標 性能 方法 裝置 | ||
1.一種提升檢測神經網絡目標檢測性能的方法,其特征在于包括步驟:
根據目標檢測神經網絡算法的輸入尺寸和原始輸入圖像尺寸確定掃描用的多個矩形滑動窗的尺寸,所述矩形滑動窗能夠按照預設的掃描規則按幀在原始輸入圖像上移動到不同的位置;
每幀檢測時,獲取各矩形滑動窗中的滑動窗子圖,將滑動窗子圖按預設角度旋轉并進行縮放處理以生成滑動窗旋轉映射子圖,將原始輸入圖像進行縮放處理以生成全圖映射子圖,所述全圖映射子圖的分辨率低于滑動窗旋轉映射子圖的分辨率;
將所述全圖映射子圖和各矩形滑動窗對應的滑動窗旋轉映射子圖組合拼接成矩形輸入圖像并作為檢測輸入圖像;
通過對應輸入尺度的目標檢測神經網絡算法對前述檢測輸入圖像進行檢測;
其中,確定掃描用的多個矩形滑動窗的尺寸的步驟為:
步驟110,根據當前設備算力確定所采用的目標檢測神經網絡算法的輸入尺寸,以及對應輸入尺寸下算法能檢測到目標的最小檢測尺寸和最大檢測尺寸;
步驟120,按照前述輸入尺寸,將檢測神經網絡算法輸入矩形分割成多個矩形子圖區,每個矩形子圖區大于等于算法能檢測的最小檢測尺寸;所述矩形子圖區包括全圖映射子圖區和滑動窗映射子圖區,所述全圖映射子圖區的長寬比與原始輸入圖像的長寬比相同用于顯示全圖映射子圖,所述滑動窗映射子圖區用于顯示對應的滑動窗旋轉映射子圖;
其中,各矩形子圖區的分割步驟如下,
步驟121,在檢測神經網絡算法輸入矩形上確定所述全圖映射子圖區的大小:根據最近檢測距離L0的目標在原始輸入圖像上的大小,選擇一個初始縮放比例,使得所述原始輸入圖像上的最近目標縮放后小于等于算法能檢測的最大檢測尺寸,以便在全圖映射子圖區上檢測到最近距離目標,同時給各滑動窗映射子圖區留下足夠空間,所述原始輸入圖像到全圖映射子圖區的縮放比例確定后,也確定了全圖映射子圖區上能檢測到的最遠檢測距離L1;
步驟122,在剩下的空間上,選擇一個矩形大小區域作為一個滑動窗映射子圖區,使得所述原始輸入圖像上距離L1的目標按預設角度旋轉并縮小后能夠落在所述滑動窗映射子圖區內,并且能夠被檢測算法檢測到;調整縮放比例,使得原始輸入圖像上最遠檢測距離L2的目標能被檢測到;
步驟123,重復步驟122以確定其他滑動窗映射子圖區的大小,將最遠檢測距離逐步擴大,直到沒有合適的空間用來設置為滑動窗映射子圖區;
步驟124,重復執行步驟121至步驟123以調整各矩形子圖區大小和對應的縮放比例,使得檢測距離最遠。
2.根據權利要求1所述的方法,其特征在于還包括步驟:將各子圖的檢測結果合并映射到原始輸入圖像上。
3.根據權利要求1或2所述的方法,其特征在于:檢測目標為橫立或倒立的目標時,將所述滑動窗子圖分別按90度或180度或270度的角度旋轉;所述矩形滑動窗的長寬比與前述檢測目標的尺寸適配。
4.根據權利要求1所述的方法,其特征在于:步驟122中,原始輸入圖像上最遠檢測距離L2的目標在原始圖像上停留所用時間長于滑動窗的一輪掃描時間。
5.根據權利要求4所述的方法,其特征在于:所述多個矩形滑動窗的大小和/或長寬比不同;
所述預設的掃描規則為從左往右從上往下順序勻速掃描全圖,或者按照隨機移動規則掃描全圖,或者按照用戶制定的順序掃描全圖。
6.根據權利要求5所述的方法,其特征在于:獲取各滑動窗子圖的檢測結果,根據前述檢測結果自適應調整矩形滑動窗掃描時的移動速度和/或停留時間。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于眸芯科技(上海)有限公司,未經眸芯科技(上海)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010835666.4/1.html,轉載請聲明來源鉆瓜專利網。





