[發明專利]一種基于可變形卷積網絡的深度學習圖像分類方法及系統在審
| 申請號: | 202110303551.5 | 申請日: | 2021-03-22 |
| 公開(公告)號: | CN113139577A | 公開(公告)日: | 2021-07-20 |
| 發明(設計)人: | 劉偉鑫;徐晨;周松斌 | 申請(專利權)人: | 廣東省科學院智能制造研究所 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/04;G06N3/08;G06K9/00 |
| 代理公司: | 廣州容大知識產權代理事務所(普通合伙) 44326 | 代理人: | 潘素云 |
| 地址: | 510070 廣東省*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 變形 卷積 網絡 深度 學習 圖像 分類 方法 系統 | ||
1.一種基于可變形卷積網絡的深度學習圖像分類方法,其特征在于,包括以下步驟:
步驟S1:將所有圖像縮放至90*90大小,并分為訓練集和測試集;
步驟S2:設定可變形卷積網絡結構;
步驟S3:將可變形卷積網絡結構的第二層和第四層的卷積核按照一定規則丟棄部分卷積核參數:
步驟S4:根據網絡模型對訓練集數據進行訓練;
步驟S5:將訓練好的模型對測試集數據進行分類識別。
2.根據權利要求1所述的基于可變形卷積網絡的深度學習圖像分類方法,其特征在于,步驟S2中,可變形卷積網絡結構具體為:第1層為輸入層,輸入90*90的圖片;第2層為卷積層,卷積核個數為16,卷積核大小為9*9;第3層為最大值池化層,核大小為2*2;第4層為卷積層,卷積核個數為16,卷積核大小為9*9;第5層為最大值池化層,核大小為2*2;第6、7層為全連接層,分別為120個和84個神經節點;第8層為輸出層,輸出節點為N。
3.根據權利要求1所述的基于可變形卷積網絡的深度學習圖像分類方法,其特征在于,步驟S3中,可變形卷積網絡結構的第二層和第四層的卷積核按照如下規則丟棄部分卷積核參數:
①將訓練集每張圖片轉換為灰度圖,再轉換為二值圖片,然后將90*90的二值圖片壓縮至9*9灰度圖,再求二值圖;
②然后將①中所有9*9的二值圖片相加,二值圖片的白色點值為1,黑色點值為0;具體為圖片每個像素點對應位置像素值相加,再除以訓練集圖片數量,然后每個像素點乘以255,得到9*9的平均灰度圖Gray;
③求平均灰度圖Gray的圖像灰度均值Mean,然后以Mean為閾值對平均灰度圖Gray進行二值化操作,得到9*9的二值圖C;
④第二層、第四層的9*9卷積核參數丟棄部分對應9*9二值圖C中像素值為0的像素位置。
4.根據權利要求3所述的基于可變形卷積網絡的深度學習圖像分類方法,其特征在于,所述二值化操作采用大津法二值化方法。
5.根據權利要求1所述的基于可變形卷積網絡的深度學習圖像分類方法,其特征在于,所述圖像縮放采用opencv的resize()函數,選擇最近鄰插值方式。
6.一種基于可變形卷積網絡的深度學習圖像分類系統,其特征在于,包括:
圖像縮放模塊,用于將所有圖像縮放至90*90大小,并分為訓練集和測試集;
網絡結構設定模塊,用于設定可變形卷積網絡結構;
參數丟棄模塊,用于將可變形卷積網絡結構的第二層和第四層的卷積核按照一定規則丟棄部分卷積核參數:
模型訓練模塊,用于根據網絡模型對訓練集數據進行訓練;
分類識別模塊,用于將訓練好的模型對測試集數據進行分類識別。
7.根據權利要求6所述的基于可變形卷積網絡的深度學習圖像分類系統,其特征在于,可變形卷積網絡結構具體為:第1層為輸入層,輸入90*90的圖片;第2層為卷積層,卷積核個數為16,卷積核大小為9*9;第3層為最大值池化層,核大小為2*2;第4層為卷積層,卷積核個數為16,卷積核大小為9*9;第5層為最大值池化層,核大小為2*2;第6、7層為全連接層,分別為120個和84個神經節點;第8層為輸出層,輸出節點為N。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣東省科學院智能制造研究所,未經廣東省科學院智能制造研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110303551.5/1.html,轉載請聲明來源鉆瓜專利網。





