[發明專利]一種基于卷積神經網絡結構提取圖像特征的方法在審
| 申請號: | 201910121702.8 | 申請日: | 2019-02-17 |
| 公開(公告)號: | CN109886331A | 公開(公告)日: | 2019-06-14 |
| 發明(設計)人: | 王楷元;段迅達;其他發明人請求不公開姓名 | 申請(專利權)人: | 太原理工大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 太原市科瑞達專利代理有限公司 14101 | 代理人: | 盧茂春 |
| 地址: | 030024 山西*** | 國省代碼: | 山西;14 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 神經網絡結構 提取圖像特征 網絡提取 卷積 卷積神經網絡 神經網絡 圖像特征 訓練過程 網絡 計算量 卷積核 彌散 降維 計算機 學習 | ||
1.一種基于卷積神經網絡結構提取圖像特征的方法,其特征是采用不同大小卷積核相結合,在提升網絡深度的同時,對網絡提取的特征進行降維。
2.根據權利要求1所述一種基于卷積神經網絡結構提取圖像特征的方法,其特征是所述網絡結構包括19個3×3的卷積層和5個最大池化層組成的11個殘差塊結構。
3.根據權利要求1所述一種基于卷積神經網絡結構提取圖像特征的方法,其特征是所述卷積核大小為1×1和3×3的組合,利用1×1的卷積核對圖像特征進行降維,再用3×3的卷積核對圖像特征進行卷積操作,提取更加精細的圖像特征,每經過一層卷積層之后都使用Relu激活函數激活,并添加批量歸一化層;每一組1×1和3×3的卷積層通過跳躍連接組成殘差塊結構。
4.根據權利要求1所述一種基于卷積神經網絡結構提取圖像特征的方法,其特征是包括下述步驟:
(1)圖像輸入,圖像經過3個3×3卷積層和2個最大池化層之后,輸出特征維度;
(2)連接殘差塊結構,再經過1個最大池化和3×3的卷積層之后輸出第一特征向量;
(3)經過2個殘差塊結構,再經過1個最大池化和3×3的卷積層輸出第二特征向量;
(4)經過4個殘差塊結構,輸出第三特征向量;
(5)經過1個最大池化和3×3的卷積層輸出的第四特征向量;
(6)經8個殘差塊結構,輸出第五特征向量并與第三特征向量進行特征融合,輸出為第五特征向量;
(7)經過3×3的卷積層和一個1×1的卷積層輸出最終特征向量,并以最終特征向量對目標類別、置信度以及位置進行預測。
5.根據權利要求1~4任意一項所述一種基于卷積神經網絡結構提取圖像特征的方法,其特征是所述圖像像素為416×416;
圖像經過3個3×3卷積層和2個最大池化層之后,輸出的特征維度為104×104×128;
(2)連接殘差塊結構,再經過1個最大池化和3×3的卷積層之后輸出的第一特征向量為52×52×256;
(3)經過2個殘差塊結構,再經過1個最大池化和3×3的卷積層輸出的第二特征向量為26×26×512;
(4)經過4個殘差塊結構,輸出的第三特征向量為26×26×512;
(5)經過1個最大池化和3×3的卷積層輸出的第四特征向量為13×13×1024;
(6)經8個殘差塊結構,輸出第五特征向量的圖像像素為13×13×1024,第五特征向量與第四特征向量進行特征融合,輸出第六特征向量為13×13×3072;
(7)經過3×3的卷積層和一個1×1的卷積層輸出最終特征向量為13×13×30。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于太原理工大學,未經太原理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910121702.8/1.html,轉載請聲明來源鉆瓜專利網。





