[發明專利]針對任意視角汽車圖片的細粒度車型識別方法有效
| 申請號: | 201811569579.8 | 申請日: | 2018-12-21 |
| 公開(公告)號: | CN109753999B | 公開(公告)日: | 2022-06-07 |
| 發明(設計)人: | 袁媛;王琦;鄭全全 | 申請(專利權)人: | 西北工業大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06V10/774;G06V10/764;G06V10/82;G06N3/04 |
| 代理公司: | 西安凱多思知識產權代理事務所(普通合伙) 61290 | 代理人: | 王鮮凱 |
| 地址: | 710072 *** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 針對 任意 視角 汽車圖片 細粒度 車型 識別 方法 | ||
1.一種針對任意視角汽車圖片的細粒度車型識別方法,其特征在于包括以下步驟:
步驟一、先將數據集原始圖片送入VGG網絡中進行訓練,訓練具有識別n類車型能力的網絡模型,所述網絡模型的訓練是在ImageNet上預訓練好的網絡模型的基礎上進行finetuning訓練,完成第一個分支網絡的訓練;
步驟二、利用預訓練好的faster r-cnn模型,對數據集原始圖片中的汽車區域進行定位,得到相應的bounding box,然后裁剪掉不必要的背景信息,得到裁剪后的汽車圖片數據集;
步驟三、將裁剪后的汽車圖片數據集送入第二個VGG網絡中,進行同步驟一類似的finetuning訓練,得到訓練好的第二個分支網絡模型;
步驟四、對裁剪后的汽車圖片數據集使用SS方法進行圖片信息的挖掘,生成多幅子圖,將生成的子圖送入第二個訓練好的VGG網絡模型中,得到多個分類概率向量,若向量中的最大值大于0.5,則保留該子圖,否則刪除;然后將這些保留下來的子圖送入第三個VGG網絡中進行finetuning訓練,得到第三個訓練好的VGG網絡模型;
步驟五、步驟一到四得到三個訓練好的VGG網絡模型網絡結構相同,但是不共享任何參數;
步驟六、根據三個分支網絡在數據集上的分類效果,給不同分支網絡的輸出賦予不同的權重,權重分別是0.3,0.5,0.2;
步驟七、將測試圖片的原始圖片同時分別送入第一個VGG網絡和faster rcnn網絡中,得出第一個VVG網絡輸出的分類概率向量和原始圖片的bounding box;
步驟八、根據步驟七得到的bounding box裁剪原始圖片,得到裁剪后的圖片,將裁剪后的圖片送入第二個VGG網絡中,得到第二個分類概率向量;同時對裁剪后的圖片使用SS生成多幅子圖,再將多幅子圖送入第二個VGG網絡中,得到多個分類概率向量,然后求取每個概率向量的最大值,只保留取到最大值所對應的那張子圖;將得到的唯一一張子圖送入第三個VGG網絡中,得到第三個分類向量;
步驟九、將得到的分類向量與步驟六中賦予每個分支網絡的權重對應相乘,再將相乘得到的三個值再相加,得到一個向量,最大值所對應的類別即是所識別的汽車類別序號;
步驟十、再根據字典查找出汽車類別序號對應的汽車類別名稱,實現車型識別。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西北工業大學,未經西北工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811569579.8/1.html,轉載請聲明來源鉆瓜專利網。





