[發明專利]一種基于深度學習的圖像識別方法在審
| 申請號: | 201711084130.8 | 申請日: | 2017-11-07 |
| 公開(公告)號: | CN107909095A | 公開(公告)日: | 2018-04-13 |
| 發明(設計)人: | 胥杏培;宋余慶;陸虎 | 申請(專利權)人: | 江蘇大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 212013 江*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 深度 學習 圖像 識別 方法 | ||
1.一種基于深度學習的圖像識別方法,其特征在于,包括如下步驟:
步驟1,采集和擴充圖像數據集:對有限的圖像進行預處理,對圖像的樣本進行擴充;
步驟2,設計卷積神經網絡:所述卷積神經網絡模型是在現有的VGG-16模型的基礎上利用卷積層代替全連接層構建;
步驟3,訓練卷積神經網絡:采用反向傳播算法和隨機梯度下降方法,根據前向傳播的loss值的大小,來進行反向傳播迭代更新每一層的權重,直到模型的loss值趨向于收斂時,停止訓練模型,得到深度學習模型;
步驟4,提取圖像的特征:將數據集中的每一幅圖像輸入到步驟3所述的深度學習模型中,針對輸入的圖像,在圖像的倒數第二層全卷積層提取深度學習特征;
步驟5,識別圖像:對于給定任意一幅待識別的圖像,輸入到訓練好的深度學習模型中,提取樣本的深度學習特征,通過兩次訓練的方法來有效的判別該圖像屬于哪個類別。
2.根據權利要求1所述的一種基于深度學習的圖像識別方法,其特征在于,所述步驟1中數據集的采集和擴充的方法包括以下方法中的至少一種:
鏡像翻轉:將原始圖像進行左右反轉,將數據擴充2倍;
添加椒鹽噪聲:將原始像中添加一些椒鹽噪聲,將數據擴充2倍;
分割圖:將原圖中的目標區域分割出來,其他區域用0代替,將數據擴充2倍。
添加光照:對圖像進行旋轉90度,180度,270度,將數據擴充3倍。
3.根據權利要求1所述的一種基于深度學習的圖像識別方法,其特征在于,所述步驟2的卷積神經網絡模型由輸入層,隱藏層,輸出層組成:
所述輸入層為步驟1所提出的圖像通過擴充后得到的數據集,將數據集轉化為lmdb格式作為該模型的輸入;
所述隱藏層包括卷積層和池化層;所述卷積層的第一層中卷積核的大小設為1*1,在倒數第二層采用全卷積代替全連接,將特征維度降低至全連接的一半。所述池化層采用2*2的卷積核,在所述模型的前五層和卷積層組合使用;
所述輸出層與最后一個全卷積層相連接,輸出的維數與待識別的圖像的類別數相等。
4.根據權利要求1所述的一種基于深度學習的圖像識別方法,其特征在于,步驟3訓練卷積神經網絡的過程中使用遷移學習的方法,將預先訓練好的VGG模型的權重遷移至所述卷積神經網絡模型上。
5.根據權利要求1所述的一種基于深度學習的圖像識別方法,其特征在于,所述步驟3所述的訓練卷積神經網絡還包括:在Ubuntu系統的caffe框架下,將圖像數據分成訓練集,訓練集標簽,測試集,測試集標簽。
6.根據權利要求1所述的一種基于深度學習的圖像識別方法,其特征在于,所述步驟4還包括:將數據集中的每一個樣本對應一行向量,并且貼上對應的標簽,構建成一個深度學習特征的數據庫。
7.根據權利要求1所述的一種基于深度學習的圖像識別方法,其特征在于,所述深度學習特征的維度為2048維度。
8.根據權利要求1所述的一種基于深度學習的圖像識別方法,其特征在于,所述步驟5中所述的兩次訓練分別是:第一次訓練是通過深度學習的方法,提取一個有效的深度學習特征;第二次訓練是將步驟4中的已經構建好的深度學習數據庫,利用SVM方法將數據庫中的數據以及標簽作為SVM的訓練集,再根據任意樣本得到的深度學習特征,作為SVM的測試集。
9.根據權利要求1-8任一項所述的一種基于深度學習的圖像識別方法,其特征在于,所述圖像識別方法應用于醫學圖像識別。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于江蘇大學,未經江蘇大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711084130.8/1.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





