[發明專利]細粒度圖像識別方法、裝置、計算機設備及存儲介質在審
| 申請號: | 201910751900.2 | 申請日: | 2019-08-15 |
| 公開(公告)號: | CN110647912A | 公開(公告)日: | 2020-01-03 |
| 發明(設計)人: | 羅茜;張斯堯;謝喜林;王思遠;黃晉;文戎;張誠 | 申請(專利權)人: | 深圳久凌軟件技術有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 43229 長沙德恒三權知識產權代理事務所(普通合伙) | 代理人: | 徐仰貴 |
| 地址: | 518000 廣東省深圳市福田區梅林街道*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 卷積神經網絡 細粒度 圖像識別 雙線性 分類識別 計算機設備 存儲介質 獲取圖像 區域檢測 人力成本 特征提取 圖像分類 圖像樣本 并聯 準確率 構建 標注 排序 樣本 圖像 分類 | ||
本發明公開了一種細粒度圖像識別方法、裝置、計算機設備及存儲介質,本發明中公開的方法包括:獲取圖像樣本,并對圖像分類屬性進行標注;構建雙線性卷積神經網絡模型,將所述圖像樣本導入所述雙線性卷積神經網絡模型中訓練,并獲得細粒度圖像識別模型;從排序和所屬類別兩個方面對所述細粒度圖像識別模型進行約束;通過所述細粒度圖像識別模型對待識別圖像進行分類識別;本發明提出的方法,通過訓練雙線性卷積神經網絡細粒度識別模型對圖形進行分類,2個并聯的卷積神經網絡CNN A和卷積神經網絡CNN B可以同時完成區域檢測和特征提取,在節省人力成本的同時,提高了分類識別的準確率。
技術領域
本發明涉及計算機圖像識別技術領域,具體涉及一種細粒度圖像識別方法、裝置、計算機設備及存儲介質。
背景技術
細粒度圖像識別是目前計算機視覺領域非常熱門的研究課題,細粒度圖像識別的目的在于正確識別一個大類中的不同小類,例如不同類別型號的車輛、不同類別的鳥類等。細粒度圖像識別的關鍵在于尋找存在細微差別的局部區域。相較于現有的粗粒度識別,細粒度圖像識別對圖像細分類識別更加精準。
目前,傳統圖像識別算法存在對圖像細分類識別準確率不高、依賴人工標注等問題。
發明內容
本發明的主要目的是提供一種細粒度圖像識別方法、裝置、計算機設備及存儲介質,旨在解決傳統圖像識別算法存在對圖像細分類識別準確率不高、依賴人工標注等問題。
為實現上述目的,本發明提供一種細粒度圖像識別方法,包括如下步驟:
獲取圖像樣本,并對圖像分類屬性進行標注;
構建雙線性卷積神經網絡模型;
將所述圖像樣本導入所述雙線性卷積神經網絡模型中訓練,并獲得細粒度圖像識別模型,其中,所述雙線性卷積神經網絡模型包括依次連接的:2個并聯的卷積神經網絡CNNA和卷積神經網絡CNN B、雙線性池化層Bilinear pooling、歸一化層LN和全連接層Fc;
從排序和所屬類別兩個方面對所述細粒度圖像識別模型進行約束;
通過所述細粒度圖像識別模型對通過圖像采集模塊獲取的待識別圖像進行分類識別。
優選的,所述獲取圖像樣本,并對圖像分類屬性進行標注與所述構建雙線性卷積神經網絡模型,之間還包括:
對所述圖像樣本做預處理,其中,所述預處理包括直方圖均衡化、圖像二值化。
優選的,所述將所述圖像樣本導入基于雙線性卷積神經網絡細粒度圖像識別模型中訓練,并獲得細粒度圖像識別模型,還包括:
將所述圖像樣本分別導入所述卷積神經網絡CNN A和所述卷積神經網絡CNN B,其中,所述卷積神經網絡CNN A包括多個依次連接的卷池組;所述卷積神經網絡CNN B也包括多個依次連接的所述卷池組;所述卷池組包括依次連接的卷積層Conv和池化層Pool;
通過所述卷積層Conv對所述圖像樣本進行卷積操作,并通過激活函數計算卷積的輸出;
通過所述池化層Pool對完成卷積操作的圖像進行下采樣操作以減少圖像尺寸大小;
所述卷積神經網絡CNN A輸出特征向量X1,所述卷積神經網絡CNN B輸出特征向量X2;
將所述特征向量X1和所述特征向量X2均輸入所述雙線性池化層Bilinearpooling;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳久凌軟件技術有限公司,未經深圳久凌軟件技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910751900.2/2.html,轉載請聲明來源鉆瓜專利網。





