[發明專利]一種基于多尺度特征卷積神經網絡的圖像場景分類方法有效
| 申請號: | 201810129756.4 | 申請日: | 2018-02-08 |
| 公開(公告)號: | CN108491856B | 公開(公告)日: | 2022-02-18 |
| 發明(設計)人: | 賴睿;徐昆然;官俊濤;王松松;莫一過;李永薛 | 申請(專利權)人: | 西安電子科技大學 |
| 主分類號: | G06V10/764 | 分類號: | G06V10/764;G06V10/774;G06V10/80;G06V10/82;G06V20/00;G06K9/62 |
| 代理公司: | 西安嘉思特知識產權代理事務所(普通合伙) 61230 | 代理人: | 劉長春 |
| 地址: | 710071*** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 尺度 特征 卷積 神經網絡 圖像 場景 分類 方法 | ||
1.一種基于多尺度特征卷積神經網絡的圖像場景分類方法,其特征在于,包括:
S1、構建原始多尺度特征卷積神經網絡;
S2、訓練所述原始多尺度特征卷積神經網絡,得到訓練的多尺度特征卷積神經網絡;
S3、獲取M個圖像數據;
S4、將所述M個圖像數據輸入到所述訓練的多尺度特征卷積神經網絡,得到M個分類向量;
S5、根據所述M個分類向量計算對應的特征向量的期望;
S6、根據所述特征向量的期望,得到特征向量期望的概率最大值,將所述概率最大值對應的分類向量作為圖像場景預處理的分類結果,其中M為正整數;
所述S1包括:
S11、構建標準卷積模塊、特征融合模塊;
S12、根據所述標準卷積模塊構造特征壓縮模塊;
S13、根據所述標準卷積模塊和所述特征融合模塊構造基本特征提取模塊;
S14、根據所述基本特征提取模塊、所述特征壓縮模塊構建原始多尺度特征卷積神經網絡;
所述S14包括:
S141、根據所述基本特征提取模塊構建i個多尺度特征提取模塊;
S142、構建所述原始多尺度特征卷積神經網絡,所述原始多尺度特征卷積神經網絡的連接順序依次為:
卷積核大小W×H=7×7,卷積核數量O=32,步進值為2的標準卷積模塊層、池化大小為Wpool×Hpool=2×2的最大池化層、多尺度特征提取系統、池化大小為Wpool×Hpool=2×2的平均池化層、全連接層、Softmax分類層;
其中,所述多尺度特征提取系統包括依次交替連接的多尺度特征提取模塊和特征壓縮模塊,且所述多尺度特征提取系統中的多尺度特征提取模塊為i個,i≥4;
所述根據所述基本特征提取模塊構建i個多尺度特征提取模塊為:
采用j個所述基本特征提取模塊構建所述多尺度特征提取模塊,所述基本特征提取模塊卷積核的大小為W×H=3×3,卷積核的數量O=32,每個所述基本特征提取模塊的連接方式如下公式所示:
xk=Fk([x1,x2,…,xk-1]),
其中xk為第k個基本特征提取模塊的輸出,Fk為第k個基本特征提取模塊的非線性變換函數,[x1,x2,…,xk-1]由k-1個基本特征提取模塊的輸出按通道方向拼接而成,其中0<k≤j。
2.根據權利要求1所述的基于多尺度特征卷積神經網絡的圖像場景分類方法,其特征在于,所述S12包括:
將一個卷積核大小為1×1,卷積核數量為32的標準卷積模塊與一個大小為Wpool×Hpool的平均池化層連接,構造特征壓縮模塊,其中Wpool表示平均池化層卷積核的寬度,Hpool表示平均池化層卷積核的高度。
3.根據權利要求1所述的基于多尺度特征卷積神經網絡的圖像場景分類方法,其特征在于,所述S13包括:
通過一個卷積核大小為W×H、卷積核數量為O的標準卷積模塊級連一個特征融合模塊構造基本特征提取模塊,其中W為卷積核的寬度,H為卷積核的高度,O為卷積核的數量。
4.根據權利要求1所述的基于多尺度特征卷積神經網絡的圖像場景分類方法,其特征在于,i個多尺度特征提取模塊中,所述基本特征提取模塊的總個數為50-200。
5.根據權利要求1所述的基于多尺度特征卷積神經網絡的圖像場景分類方法,其特征在于,第一個所述多尺度特征提取模塊的基本特征提取模塊數量小于或等于第一個所述多尺度特征提取模塊的基本特征提取模塊數量,且第i個所述多尺度特征提取模塊的基本特征提取模塊數量大于或等于第i-1個所述多尺度特征提取模塊的基本特征提取模塊數量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西安電子科技大學,未經西安電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810129756.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種信號機故障識別方法
- 下一篇:一種視域重疊的多攝像機目標匹配方法





