[發明專利]一種基于卷積神經網絡模型的危險物品圖像分類方法在審
| 申請號: | 201610119110.9 | 申請日: | 2016-03-03 |
| 公開(公告)號: | CN105631482A | 公開(公告)日: | 2016-06-01 |
| 發明(設計)人: | 屈景怡;吳仁彪;朱威;李佳怡 | 申請(專利權)人: | 中國民航大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/08 |
| 代理公司: | 天津才智專利商標代理有限公司 12108 | 代理人: | 龐學欣 |
| 地址: | 300300 天*** | 國省代碼: | 天津;12 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 卷積 神經網絡 模型 危險物品 圖像 分類 方法 | ||
技術領域
本發明屬于圖像分類技術領域,特別是涉及一種基于卷積神經網絡模型的危險物 品圖像分類方法。
背景技術
人工神經網絡是一種用于嘗試模擬人腦的功能而產生的人工智能方法,在上個世 紀末期經歷了一段時間的蓬勃發展之后再次陷入低潮。深度學習技術是受到生物學和神經 學領域在動物和人腦視覺神經領域的新發現的啟發,模擬視覺系統的層次化的工作模式, 在人工神經網絡的基礎上構建具有層次化結構的深度網絡模型,給人工神經網絡帶來了新 的發展方向。
卷積神經網絡是將人工神經網絡和深度學習技術結合而產生的一種新型人工神 經網絡,是目前人工神經網絡領域的研究熱點,其與傳統方法相比,在圖像分類領域具有很 好的應用效果。之前卷積神經網絡之所以沒有得到長遠發展是因為硬件計算能力有限,可 供訓練的數據也有限,如今隨著硬件計算性能的穩步提高,各種圖像數據急速增長,這些都 為其發展奠定了基礎。
訓練卷積神經網絡需要大的數據集,比如ImageNet。現在的卷積神經網絡可以充 分利用海量數據自動學習到大量圖像的特征信息。ImageNet中含有很多種圖像的類別,其 中一些是民航中危險物品的類別,因此,可以利用卷積神經網絡來進行民航危險物品圖像 的檢測。
此外,由于卷積方法在圖像處理領域本質上是使圖像變得平滑,因此,像素的平移 對分類結果的影響較小,而圖像的旋轉對分類的結果影響較大。因此,對于卷積神經網絡不 能識別的圖像,將其旋轉后再進行分類,有可能得到正確的分類結果,從而可提高圖像分類 的準確率,但目前尚未發現有效的方法。
發明內容
為了解決上述問題,本發明的目的在于提供一種分類準確率高,分類速度快的基 于卷積神經網絡模型的危險物品圖像分類方法。
為了達到上述目的,本發明提供的基于卷積神經網絡模型的危險物品圖像分類方 法包括按順序進行的下列步驟:
1)在圖形處理器上搭建基于包含多種卷積神經網絡模型的Caffe深度學習框架的 平臺;
2)準備訓練數據集和帶有標簽的測試數據集,并利用上述數據集在圖形處理器上 訓練上述卷積神經網絡模型;
3)列出中國民航中危險物品類別;
4)將上述危險物品類別中的原始圖像和旋轉180度后的圖像輸入上述已訓練好的 卷積神經網絡模型,得到top-5測試結果,實現含有危險物品圖像的分類。
在步驟2)中,所述的訓練數據集是由從ImageNet數據集中選擇的0.12億張訓練圖 像組成;測試數據集采用帶有標簽的確認數據集;卷積神經網絡模型采用CaffeNet、VGG和 GoogleNet。
本發明提供的基于卷積神經網絡模型的危險物品圖像分類方法具有的優點和積 極效果是:(1)本發明采用了現在人工智能中圖像分類最好的深度學習方法,分類準確率 高;(2)綜合考慮了原始圖像和旋轉后圖像的分類效果,進一步提高了分類準確率;(3)采用 海量的訓練樣本來訓練深度卷積神經網絡模型,使模型具有高智能性;(4)基于圖形處理器 計算,訓練和測試速度比基于CPU的計算有大幅度的提高。
附圖說明
圖1為基于深層卷積神經網絡的圖像分類方法對比(a)只考慮原始圖像;(b)考慮 旋轉180度后的圖像;
圖2為經過CaffeNet模型,旋轉前不能識別而旋轉后可以識別的圖像示例;
圖3為使用四種卷積神經網絡,考慮圖像旋轉的top_5準確率對比曲線。(a) CaffeNet;(b)VGG16;(c)VGG19;(d)GoogleNet。
圖4為Top-k對于準確率的影響曲線。(a)類別413;(b)類別763。
具體實施方式
下面結合附圖和具體實施例對本發明提供的基于卷積神經網絡模型的危險物品 圖像分類方法進行詳細說明。
本發明提供的基于深層卷積神經網絡的圖像分類方法包括按順序進行的下列步 驟:
1)在圖形處理器上搭建基于包含多種卷積神經網絡模型的Caffe深度學習框架的 平臺;
Caffe是目前流行的高效深度學習框架之一,具有純粹的C++/CUDA架構,支持命令 行、Python和MATLAB接口,可以在CPU和圖形處理器上直接無縫切換。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國民航大學,未經中國民航大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610119110.9/2.html,轉載請聲明來源鉆瓜專利網。





