[發明專利]基于D-MobileNet神經網絡的圖像分類方法有效
| 申請號: | 201810465364.5 | 申請日: | 2018-05-16 |
| 公開(公告)號: | CN109214406B | 公開(公告)日: | 2021-07-09 |
| 發明(設計)人: | 王威;鄒婷;王新 | 申請(專利權)人: | 長沙理工大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 410114 湖*** | 國省代碼: | 湖南;43 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 mobilenet 神經網絡 圖像 分類 方法 | ||
1.基于D-MobileNet神經網絡圖像分類方法,其特征在于,所述方法包括如下步驟:
S1、準備數據集;
S2、MobileNet神經網絡的構建;
S3、D-MobileNet神經網絡的構建;
S4、超參數設置;
其中,S1的步驟包括:在Caltech_256數據集上進行實驗,將圖片轉換為tfrecord的形式進行存儲,并在訓練和測試時對圖片進行預處理,可擴大數據集圖片的數量,防止過擬合;
S2的步驟包括:MobileNet神經網絡是以深度可分離卷積核為基本結構的28層網絡的深度卷積神經網絡,一個深度可分離核由深度卷積核和點卷積核組成。MobileNet神經網絡包括、1層卷積層、13層深度可分離層、一個全局平均池化層和一層全連接輸出層,且該網絡無池化層;
S3的步驟包括:選定卷積層的層數,將該層數的卷積核由空洞卷積核替代,通過提高該卷積核的感受野來提高所學習到的特征的質量,進一步提高分類準確度;其中,替代的卷積核為排序靠前的一層或兩層高分辨率輸入特征的卷積層;
S4的步驟包括:對不同的mini_batch、learning_rate、momentum、訓練步長進行優化。
2.根據權利要求1所述的基于D-MobileNet神經網絡圖像分類方法,其特征在于,在準備數據集時,將圖像從tfrecord中讀取出來,并進行隨機的左右翻轉,隨機裁剪成指定尺寸的圖片大小,使得在神經網絡訓練完數據集的一個回合后,重新訓練數據集時,可以使得重新訓練的輸入圖片與前一次的訓練圖片有差異,可擴大數據集圖片的數量,避免網絡容易造成過擬合的問題。
3.根據權利要求1所述的基于D-MobileNet神經網絡圖像分類方法,其特征在于,搭建MobileNet神經網絡時,對Conv1卷積層設計方法如下:對輸入的原始圖片進行邊緣補償處理,使得防止特征圖減小過快,對處理過后的圖片進行卷積操作,設置卷積核的大小和滑動步長,卷積處理后得到特征圖,再經過一個Batch Normalization即BN處理,再經過ReLU激活函數得到特征映射圖,作為下一層卷積層的輸入;
對Conv2卷積層設計方法如下:該層為深度可分離層,由深度卷積層和點卷積層兩層組成。將Conv1的輸出作為Conv2深度卷積層的輸入,且進行邊緣補償操作,對處理過后的輸入進行卷積操作,設置卷積核大小和步長,卷積處理后得到特征圖,再經過一個BatchNormalization即BN處理,再經過ReLU激活函數得到特征映射圖,作為點卷積核的輸入,進行點卷積操作,得到特征圖,再經過一個Batch Normalization即BN處理,再經過ReLU激活函數得到特征映射圖,作為下一層的輸入;
后面的12層深度可分離層與Conv2卷積層設計方法相同;
對Avg_Pool15平均池化層設計方法如下:將Conv14卷積層的輸出特征映射圖進行平均池化,設置池化層卷積核大小,使得最后的輸出特征圖大小為1×1;
對FC16全連接分類層設計方法如下:將Avg_Pool15平均池化層的輸出輸入到FC16全連接層中,神經元個數為數據集的類別數,最后經過Softmax分類器進行分類。
4.根據權利要求1所述的基于D-MobileNet神經網絡圖像分類方法,其特征在于,對D-MobileNet進行構建時,在高分辨率輸入特征圖的卷積層中,將空洞卷積代替傳統的卷積進行卷積操作,重點在于選取的卷積層層數,選取卷積層層數的方式包括:
將Conv1卷積層中的卷積核用空洞卷積核替代:此方法會增加少量計算量。將MobileNet神經網絡Conv1卷積層步長設置為1,使得Conv1卷積層中的卷積核能用空洞卷積替代,為了最后全局平均池化層的輸入尺寸大小與MobileNet相同,且只增加最少的計算量,在第二層的深度可分離層中的深度卷積層的步長設置為2,后面的卷積層不變;或,
將Conv2卷積層中的深度卷積層中的卷積核用空洞卷積核替代:此方法,不增加網絡參數和計算量,不需改變網絡其他卷積層的超參數。
5.根據權利要求1所述的基于D-MobileNet神經網絡圖像分類方法,其特征在于,超參數的設置,選取幾組超參數,最后選定準確度最好的超參數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于長沙理工大學,未經長沙理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810465364.5/1.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





