[發明專利]圖像檢測方法、裝置及計算機可讀存儲介質在審
| 申請號: | 201810034651.0 | 申請日: | 2018-01-15 |
| 公開(公告)號: | CN108376235A | 公開(公告)日: | 2018-08-07 |
| 發明(設計)人: | 劉新;宋朝忠;郭烽;周曉帆 | 申請(專利權)人: | 深圳市易成自動駕駛技術有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62;G06N3/08 |
| 代理公司: | 深圳市世紀恒程知識產權代理事務所 44287 | 代理人: | 胡海國;魏蘭 |
| 地址: | 518000 廣東省深圳市南山區西麗街*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 卷積神經網絡 圖像檢測 訓練樣本 檢測框 計算機可讀存儲介質 模型檢測 圖像檢測裝置 待檢測圖像 迭代訓練 分類結果 模型參數 圖像數據 下降算法 訓練數據 預設算法 真實分類 坐標信息 準確率 標注 圖像 分類 更新 | ||
1.一種圖像檢測方法,其特征在于,所述圖像檢測方法包括以下步驟:
獲取訓練樣本,所述訓練樣本為對經標注的包含車輛和行人的圖像數據進行擴充后得到的;
提取所述訓練樣本的第一特征,對所述第一特征進行分類,并根據所述第一特征對應的坐標信息得到對應的第一檢測框坐標;
根據分類結果、所述第一檢測框坐標及所述訓練樣本的真實分類信息和真實檢測框坐標信息,通過預設算法計算得到總損失;
根據所述總損失通過梯度下降算法對卷積神經網絡模型參數進行更新,并對所述訓練樣本進行迭代訓練,得到訓練好的卷積神經網絡模型;
獲取包含車輛和行人的待檢測圖像,并利用所述訓練好的卷積神經網絡模型檢測得到所述待檢測圖像的車輛和行人信息。
2.如權利要求1所述的圖像檢測方法,其特征在于,所述提取所述訓練樣本的第一特征,對所述第一特征進行分類,并根據所述第一特征對應的坐標信息得到對應的第一檢測框坐標的步驟之前,包括:
基于遷移學習的方法從預設多分類模型中獲得對應的原始特征提取網絡模型,并根據所述原始特征提取網絡模型構建所述卷積神經網絡模型。
3.如權利要求2所述的圖像檢測方法,其特征在于,所述提取所述訓練樣本的第一特征,對所述第一特征進行分類,并根據所述第一特征對應的坐標信息得到對應的第一檢測框坐標的步驟,包括:
利用所述卷積神經網絡模型生成與所述訓練樣本對應的第一原始特征圖,并根據所述第一原始特征圖得到包含有車輛和/或行人的第一區域坐標;
根據所述第一區域坐標和第一原始特征圖獲得對應的第一感興趣區域,并提取所述第一感興趣區域的第一特征;
對所述第一特征進行分類,并根據所述第一特征對應的坐標信息得到對應的第一檢測框坐標。
4.如權利要求1所述的圖像檢測方法,其特征在于,所述根據分類結果、所述第一檢測框坐標及所述訓練樣本的真實分類信息和真實檢測框坐標信息,通過預設算法計算得到總損失的步驟,包括:
根據第一分類結果和所述訓練樣本的真實分類信息計算得到分類損失;
根據所述第一檢測框坐標和所述訓練樣本的真實檢測框坐標信息計算得到位置回歸損失;
根據所述分類損失和位置回歸損失以及各自對應的預設權重系數計算得到總損失。
5.如權利要求1所述的圖像檢測方法,其特征在于,所述車輛和行人信息包括車輛和行人分類信息及對應的第二檢測框坐標信息,所述獲取包含車輛和行人的待檢測圖像,并利用所述訓練好的卷積神經網絡模型檢測得到所述待檢測圖像的車輛和行人信息的步驟,包括:
獲取包含車輛和行人的待檢測圖像,并利用所述訓練好的卷積神經網絡模型提取所述待檢測圖像的第二特征;
根據所述第二特征檢測得到所述車輛和行人分類信息及對應的第二檢測框坐標信息。
6.如權利要求5所述的圖像檢測方法,其特征在于,所述獲取包含車輛和行人的待檢測圖像,并利用所述訓練好的卷積神經網絡模型提取所述待檢測圖像的第二特征的步驟,包括:
獲取包含車輛和行人的待檢測圖像,并利用所述訓練好的卷積神經網絡模型生成與所述待檢測圖像對應的第二原始特征圖;
根據所述第二原始特征圖得到包含有車輛和/或行人的第二區域坐標;
根據所述第二區域坐標和第二原始特征圖獲得對應的第二感興趣區域,并提取所述第二感興趣區域的第二特征。
7.如權利要求1所述的圖像檢測方法,其特征在于,所述獲取訓練樣本,所述訓練樣本為對經標注的包含車輛和行人的圖像數據進行擴充后得到的的步驟,包括:
獲取經標注的包含車輛和行人的圖像數據;
采用預設數據擴增方法對所述圖像數據進行擴充,得到訓練樣本。
8.如權利要求7所述的圖像檢測方法,其特征在于,所述預設數據擴增方法包括圖像平移方法、圖像旋轉方法、圖像亮度變化方法、圖像鏡像方法、圖像裁剪方法、圖像縮放方法和圖像模糊方法中的一種或多種。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳市易成自動駕駛技術有限公司,未經深圳市易成自動駕駛技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810034651.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:用于視頻圖像的情感識別系統及方法
- 下一篇:人臉識別顯示裝置





