[發明專利]一種基于多尺度特征卷積神經網絡的圖像場景分類方法有效
| 申請號: | 201810129756.4 | 申請日: | 2018-02-08 |
| 公開(公告)號: | CN108491856B | 公開(公告)日: | 2022-02-18 |
| 發明(設計)人: | 賴睿;徐昆然;官俊濤;王松松;莫一過;李永薛 | 申請(專利權)人: | 西安電子科技大學 |
| 主分類號: | G06V10/764 | 分類號: | G06V10/764;G06V10/774;G06V10/80;G06V10/82;G06V20/00;G06K9/62 |
| 代理公司: | 西安嘉思特知識產權代理事務所(普通合伙) 61230 | 代理人: | 劉長春 |
| 地址: | 710071*** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 尺度 特征 卷積 神經網絡 圖像 場景 分類 方法 | ||
本發明公開了一種基于多尺度特征卷積神經網絡的圖像場景分類方法,包括:S1、構建原始多尺度特征卷積神經網絡;S2、訓練所述原始多尺度特征卷積神經網絡,得到訓練的多尺度特征卷積神經網絡;S3、獲取M個圖像數據;S4、將所述M個圖像數據輸入到所述訓練的多尺度特征卷積神經網絡,得到M個分類向量;S5、根據所述M個分類向量計算對應的特征向量的期望;S6、根據所述特征向量的期望,得到特征向量期望的概率最大值,將所述概率最大值對應的分類向量作為圖像場景預處理的分類結果,其中M為正整數。本發明提出的基于多尺度特征卷積神經網絡的場景分類方法更好,具有更高的特征提取能力,具有更高的場景分類正確率。
技術領域
本發明屬于圖像處理技術領域,具體涉及一種基于多尺度特征卷積神經網絡的圖像場景分類方法。
背景技術
信息技術的發展使得圖像數據迅速增多,如何使用計算機對這些圖像進行分類管理成了人們研究的目標,圖像場景分類技術就是一種對圖像數據進行有效的組織和管理的手段。最終目標是將圖像轉化成計算機可以理解和處理的數據,最終實現自動分類和管理圖像數據。因此圖像場景分類對后續的支持基于圖像語義的圖像檢索和圖像瀏覽等功能提供了重要的基礎。
現存的圖像場景分類方法主要有兩大類,一是通過計算條件分布概率進行分類的,如:神經網絡算法,邏輯回歸方法,支持向量機等;二是通過尋找數據的聯合分布概率進行分類的,如:貝葉斯網絡層級模型,高斯模型,隱馬爾科夫模型等。
然而,現有的這些方法對圖像中的細節以及顏色信息都不敏感,因此無法實現一個較為準確的分類結果。
發明內容
為了解決現有技術中存在的上述問題,本發明提供了一種基于多尺度特征卷積神經網絡的圖像場景分類方法。本發明要解決的技術問題通過以下技術方案實現:
本發明實施例提供了一種基于多尺度特征卷積神經網絡的圖像場景分類方法,包括:
S1、構建原始多尺度特征卷積神經網絡;
S2、訓練所述原始多尺度特征卷積神經網絡,得到訓練的多尺度特征卷積神經網絡;
S3、獲取M個圖像數據;
S4、將所述M個圖像數據輸入到所述訓練的多尺度特征卷積神經網絡,得到M個分類向量;
S5、根據所述M個分類向量計算對應的特征向量的期望;
S6、根據所述特征向量的期望,得到特征向量期望的概率最大值,將所述概率最大值對應的分類向量作為圖像場景預處理的分類結果,其中M為正整數。
在一個具體實施例中,所述S1包括:
S11、構建標準卷積模塊、特征融合模塊;
S12、根據所述標準卷積模塊構造特征壓縮模塊;
S13、根據所述標準卷積模塊和所述特征融合模塊構造基本特征提取模塊;
S14、根據所述基本特征提取模塊、所述特征壓縮模塊構建原始多尺度特征卷積神經網絡。
在一個具體實施例中,所述S12包括:
將一個卷積核大小為1×1,卷積核數量為32的標準卷積模塊與一個大小為Wpool×Hpool的平均池化層連接,構造特征壓縮模塊,其中Wpool表示平均池化層卷積核的寬度,Hpool表示平均池化層卷積核的高度。
在一個具體實施例中,所述S13包括:
通過一個卷積核大小為W×H、卷積核數量為O的標準卷積模塊級連一個特征融合模塊構造基本特征提取模塊,其中W為卷積核的寬度,H為卷積核的高度,O為卷積核的數量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西安電子科技大學,未經西安電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810129756.4/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種信號機故障識別方法
- 下一篇:一種視域重疊的多攝像機目標匹配方法





