[發(fā)明專利]目標檢測方法及裝置、計算機裝置和計算機可讀存儲介質(zhì)有效
| 申請?zhí)枺?/td> | 201711484723.3 | 申請日: | 2017-12-29 |
| 公開(公告)號: | CN108121986B | 公開(公告)日: | 2019-12-17 |
| 發(fā)明(設計)人: | 牟永強;劉榮杰;裴超 | 申請(專利權)人: | 深圳云天勵飛技術有限公司 |
| 主分類號: | G06K9/32 | 分類號: | G06K9/32;G06K9/46;G06N3/04;G06N3/08 |
| 代理公司: | 44334 深圳市賽恩倍吉知識產(chǎn)權代理有限公司 | 代理人: | 曾柳燕;孫芬 |
| 地址: | 518000 廣東省深圳市*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 目標檢測 卷積神經(jīng)網(wǎng)絡 待檢測圖像 訓練樣本集 加速區(qū)域 計算機裝置 目標區(qū)域 計算機可讀存儲介質(zhì) 可讀存儲介質(zhì) 目標檢測裝置 目標圖像 目標位置 標注 | ||
一種目標檢測方法,所述方法包括:獲取訓練樣本集,所述訓練樣本集包括多個標注有目標位置和目標角度類型的目標圖像;使用所述訓練樣本集對加速區(qū)域卷積神經(jīng)網(wǎng)絡模型進行訓練,得到訓練好的加速區(qū)域卷積神經(jīng)網(wǎng)絡模型;獲取待檢測圖像;利用所述訓練好的加速區(qū)域卷積神經(jīng)網(wǎng)絡模型對所述待檢測圖像進行目標檢測,得到所述待檢測圖像的目標區(qū)域和所述目標區(qū)域的目標角度類型。本發(fā)明還提供一種目標檢測裝置、計算機裝置及可讀存儲介質(zhì)。本發(fā)明可以實現(xiàn)快速高檢出率的目標檢測。
技術領域
本發(fā)明涉及圖像處理技術領域,具體涉及一種目標檢測方法及裝置、計算機裝置和計算機可讀存儲介質(zhì)。
背景技術
現(xiàn)有的目標檢測技術包括基于簡單像素特征或手工設計的復雜特征的目標檢測。使用簡單像素特征,比如具有代表性的HAAR、像素差值等,雖然計算效率高,實時性好,但是對于復雜多樣性的背景變化等因素的魯棒性較差,檢測精度上有所欠缺。而基于手工設計的復雜特征,比如DPM中的HOG等,雖然特征表達的更好,魯棒性較強,但是因為不能使用GPU加速,在CPU上計算復雜,難以達到實時性的要求。
現(xiàn)有的目標檢測技術還包括基于卷積神經(jīng)網(wǎng)絡的目標檢測。基于卷積神經(jīng)網(wǎng)絡的目標檢測方法雖然提升了檢測的精度,但隨之而來的是計算量的大幅度提升。雖然GPU計算解決提取卷積特征的計算問題,但是候選區(qū)域提取仍然耗費相當長的時間。此外,由于整個方案是先提取候選區(qū)域,再進行分類的框架流程,導致無法實現(xiàn)端到端的檢測,應用起來也相對繁瑣。
此外,由于拍攝角度不同,目標物體的外觀在圖像上會發(fā)生比較大的變化,現(xiàn)有的目標檢測技術未考慮拍攝角度的問題,導致目標的檢出率較低。
發(fā)明內(nèi)容
鑒于以上內(nèi)容,有必要提出一種目標檢測方法及裝置、計算機裝置和計算機可讀存儲介質(zhì),其可以實現(xiàn)快速高檢出率的目標檢測。
本申請的第一方面提供一種目標檢測方法,所述方法包括:
獲取訓練樣本集,所述訓練樣本集包括多個標注有目標位置和目標角度類型的目標圖像;
使用所述訓練樣本集對加速區(qū)域卷積神經(jīng)網(wǎng)絡模型進行訓練,得到訓練好的加速區(qū)域卷積神經(jīng)網(wǎng)絡模型,所述加速區(qū)域卷積神經(jīng)網(wǎng)絡模型包括區(qū)域建議網(wǎng)絡和快速區(qū)域卷積神經(jīng)網(wǎng)絡,所述區(qū)域建議網(wǎng)絡和所述快速區(qū)域卷積神經(jīng)網(wǎng)絡共享卷積層,所述卷積層提取所述訓練樣本集中各個目標圖像的特征圖,所述區(qū)域建議網(wǎng)絡根據(jù)所述特征圖獲取所述各個目標圖像中的候選區(qū)域以及所述候選區(qū)域的目標角度類型,所述快速區(qū)域卷積神經(jīng)網(wǎng)絡根據(jù)所述特征圖對所述候選區(qū)域進行篩選和調(diào)整,得到所述各個目標圖像的目標區(qū)域和所述目標區(qū)域的目標角度類型;
獲取待檢測圖像;
利用所述訓練好的加速區(qū)域卷積神經(jīng)網(wǎng)絡模型中的對所述待檢測圖像進行目標檢測,得到所述待檢測圖像的目標區(qū)域和所述目標區(qū)域的目標角度類型。
另一種可能的實現(xiàn)方式中,所述使用所述訓練樣本集對加速區(qū)域卷積神經(jīng)網(wǎng)絡模型進行訓練包括:
(1)使用Imagenet模型初始化所述區(qū)域建議網(wǎng)絡,使用所述訓練樣本集訓練所述區(qū)域建議網(wǎng)絡;
(2)使用(1)中訓練后的區(qū)域建議網(wǎng)絡生成所述各個目標圖像的候選區(qū)域,利用所述候選區(qū)域訓練所述快速區(qū)域卷積神經(jīng)網(wǎng)絡;
(3)使用(2)中訓練后的快速區(qū)域卷積神經(jīng)網(wǎng)絡初始化所述區(qū)域建議網(wǎng)絡,使用所述訓練樣本集訓練所述區(qū)域建議網(wǎng)絡;
(4)使用(3)中訓練后的區(qū)域建議網(wǎng)絡初始化所述快速區(qū)域卷積神經(jīng)網(wǎng)絡,并保持所述卷積層固定,使用所述訓練樣本集訓練所述快速區(qū)域卷積神經(jīng)網(wǎng)絡。
另一種可能的實現(xiàn)方式中,所述使用所述訓練樣本集對加速區(qū)域卷積神經(jīng)網(wǎng)絡模型進行訓練包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳云天勵飛技術有限公司,未經(jīng)深圳云天勵飛技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711484723.3/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 終端卷積神經(jīng)網(wǎng)絡的處理方法、裝置、存儲介質(zhì)及處理器
- 一種基于卷積神經(jīng)網(wǎng)絡的圖像深度估計方法
- 卷積神經(jīng)網(wǎng)絡的生成方法及裝置
- 一種卷積神經(jīng)網(wǎng)絡硬件模塊部署方法
- 卷積神經(jīng)網(wǎng)絡的處理方法、裝置、設備及存儲介質(zhì)
- 一種卷積神經(jīng)網(wǎng)絡的訓練方法及裝置
- 一種基于通道數(shù)搜索卷積神經(jīng)網(wǎng)絡的方法
- 卷積神經(jīng)網(wǎng)絡處理方法、裝置和電子系統(tǒng)
- 一種基于空洞卷積循環(huán)神經(jīng)網(wǎng)絡的聲音事件檢測方法
- 基于稀疏卷積神經(jīng)網(wǎng)絡的目標檢測方法及檢測裝置





