[發明專利]物體檢測方法、網絡訓練方法、裝置和計算機存儲介質有效
| 申請號: | 201810143218.0 | 申請日: | 2018-02-11 |
| 公開(公告)號: | CN108388859B | 公開(公告)日: | 2022-04-15 |
| 發明(設計)人: | 岳曉宇;曠章輝;張兆陽;陳振方;張偉 | 申請(專利權)人: | 深圳市商湯科技有限公司 |
| 主分類號: | G06V10/25 | 分類號: | G06V10/25;G06V20/40;G06N3/08 |
| 代理公司: | 北京派特恩知識產權代理有限公司 11270 | 代理人: | 李梅香;張穎玲 |
| 地址: | 518057 廣東省深圳市*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 物體 檢測 方法 網絡 訓練 裝置 計算機 存儲 介質 | ||
本發明實施例公開了一種基于深度學習的物體檢測方法、網絡訓練方法、裝置和計算機存儲介質。所述檢測方法包括:基于第一圖像數據和區域估計網絡,獲得第二圖像數據,所述第二圖像數據包括所述第一圖像數據中待檢測物體的估計區域;將所述第一圖像數據和所述第二圖像數據輸入物體檢測網絡,以使所述物體檢測網絡基于所述估計區域對所述第一圖像數據進行檢測,獲得所述第一圖像數據中所述待檢測物體的實際區域。
技術領域
本發明涉及圖像處理技術領域,具體涉及一種基于深度學習的物體檢測方法、網絡訓練方法、裝置和計算機存儲介質。
背景技術
物體檢測是計算機視覺領域的重要問題之一,在多種任務諸如自動駕駛、場景分析、人臉分析中有著重要的應用。隨著目前深度學習技術的大規模落地,檢測算法的運行平臺有可能是性能比較低的手機或者嵌入式平臺,過慢的檢測速度或者過差的檢測效果必然會降低用戶體驗。
發明內容
為解決現有存在的技術問題,本發明實施例提供一種基于深度學習的物體檢測方法、網絡訓練方法、裝置和計算機存儲介質。
本發明實施例的技術方案是這樣實現的:
本發明實施例提供了一種基于深度學習的物體檢測方法,所述方法包括:
基于第一圖像數據和區域估計網絡,獲得第二圖像數據,所述第二圖像數據包括所述第一圖像數據中待檢測物體的估計區域;
將所述第一圖像數據和所述第二圖像數據輸入物體檢測網絡,以使所述物體檢測網絡基于所述估計區域對所述第一圖像數據進行檢測,獲得所述第一圖像數據中所述待檢測物體的檢測區域。
上述方案中,所述方法還包括:
獲得用于網絡訓練的第四圖像數據,以及所述第四圖像數據中包括的標注區域對應的標注信息;所述標注區域表征所述第四圖像數據中物體所在區域;
采用包含有向卷積層的卷積神經網絡對攜帶有標注區域的所述第四圖像數據、所述標注區域對應的標注信息進行訓練,獲得物體檢測網絡,所述卷積神經網絡用于在訓練過程中對所述第四圖像數據的標注區域進行計算處理。
上述方案中,所述采用包含有向卷積層的卷積神經網絡對攜帶有標注區域的所述第四圖像數據、所述標注區域對應的標注信息進行訓練,獲得物體檢測網絡,包括:
確定除所述標注區域以外的背景區域的部分背景區域;所述部分背景區域采用隨機方式從所述背景區域中確定;
將所述部分背景區域添加至所述標注區域,生成所述第三圖像數據的更新標注區域;
基于有向卷積層分別識別所述第四圖像數據中的標注區域和更新標注區域,對所述標注區域中的圖像數據以及對應的標注信息進行訓練,以及對所述更新標注區域中的圖像數據以及對應的標注信息進行訓練,獲得物體檢測網絡。
上述方案中,所述基于第一圖像數據和區域估計網絡,獲得第二圖像數據,包括:
對所述第一圖像數據進行卷積處理,獲得所述第一圖像數據對應的第一特征圖;
將所述特征圖輸入至少一個池化層,獲得與所述特征圖的尺度不同的至少一個第二特征圖;
對具有不同尺度的所述第一特征圖、所述至少一個第二特征圖分別進行卷積處理,對卷積處理后的所述第一特征圖、所述至少一個第二特征圖進行融合,輸出攜帶有標識待檢測物體的估計區域的第二圖像數據。
上述方案中,所述輸出攜帶有標識待檢測物體的估計區域的第二圖像數據,包括:
對融合后的所述第一特征圖、所述至少一個第二特征圖進行二值化處理,輸出二值化表示的攜帶有標識待檢測物體的估計區域的第二圖像數據。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳市商湯科技有限公司,未經深圳市商湯科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810143218.0/2.html,轉載請聲明來源鉆瓜專利網。





