[發明專利]一種改進重構網絡的膠囊網絡圖像分類識別方法有效
| 申請號: | 201810509412.6 | 申請日: | 2018-05-24 |
| 公開(公告)號: | CN108985316B | 公開(公告)日: | 2022-03-01 |
| 發明(設計)人: | 段書凱;張金;鄒顯麗;王麗丹;耿陽陽;陸春燕 | 申請(專利權)人: | 西南大學 |
| 主分類號: | G06V10/774 | 分類號: | G06V10/774;G06V10/764;G06K9/62;G06N3/04;G06V10/82 |
| 代理公司: | 重慶為信知識產權代理事務所(普通合伙) 50216 | 代理人: | 余錦曦 |
| 地址: | 400715*** | 國省代碼: | 重慶;50 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 改進 網絡 膠囊 圖像 分類 識別 方法 | ||
本發明公開一種改進重構網絡的膠囊網絡圖像分類識別方法:S1,構建膠囊網絡;S2,輸入圖像訓練集合至所述膠囊網絡,所述膠囊網絡經訓練學習后完成圖像分類識別校準;S3,輸入待分類圖像至所述膠囊網絡,所述工作網絡的輸出向量vj中數值最大的一個即為得到的識別結果;S4,所述膠囊網絡輸出所述待分類圖像的識別結果;其中膠囊網絡的重構網絡結構為反卷積操作。有益效果:提出了一種新的重構網絡結構,通過反卷積操作把向量還原為圖像,對比還原的圖像和原始圖像的誤差來調節網絡參數,減小了計算參數量,為硬件設備空出了更多運行內存。
技術領域
本發明涉及膠囊網絡在圖像分類中的應用,具體的說,涉及一種改進重構網絡的膠囊網絡圖像分類識別方法。
背景技術
近年來,卷積神經網絡在圖像識別、目標檢測、語義分割等方向取得了快速的發展,卷積神經網絡通常由卷積層、激活層、池化層和全連接層組成,池化層是卷積神經網絡中重要的組成部分,典型的為最大池化和平均池化操作,池化層能夠減小輸入特征圖的尺寸,降低模型的計算量,但是池化層也存在位置信息丟失的問題。
針對卷積神經網絡中池化層存在位置信息丟失的問題,2017年Hinton提出了膠囊網絡(capsnet),膠囊網絡采用向量作為輸入輸出,并采用了動態路由機制進行參數更新,能夠提取到位置信息,相對卷積神經網絡能夠提取到更加準確的特征信息,有望取代現階段的卷積神經網絡結構。
然而,現有的膠囊網絡設計在圖像處理問題上還存在參數量大的缺點,模型占用內存大,運行硬件同時處理的數據量少。
發明內容
為了解決膠囊網絡參數量大的問題,本發明針對現有膠囊網絡提出了一種新的重構網絡結構,通過反卷積操作把向量還原為圖像,對比還原的圖像和原始圖像的誤差來調節網絡參數,從而提供一種改進重構網絡的膠囊網絡圖像分類識別方法,減小了計算參數量,為硬件設備空出了更多運行內存。
為達到上述目的,本發明采用的具體技術方案如下:
一種改進重構網絡的膠囊網絡圖像分類識別方法:
S1,構建膠囊網絡,所述膠囊網絡設置有工作網絡與校對網絡,所述工作網絡用于輸入圖像并輸出該圖像的識別結果,所述校對網絡用于訓練調節工作網絡參數;
所述工作網絡包括卷積結構和全連接結構,所述卷積結構的卷積輸出端連接全連接結構的全連接輸入端,所述卷積結構為依次連接的卷積層和PrimaryCaps層,所述全連接結構為依次進行權重計算、動態路由調節、激活函數運算的網絡結構;
所述校對網絡包括并行的margin loss運算結構和重構網絡結構,所述marginloss運算結構的損失輸入端連接所述全連接結構的全連接輸出端,所述重構網絡結構的重構輸入端分別連接所述全連接結構的全連接輸出端和輸入圖像的向量層,所述margin loss運算結構的損失輸出端與所述重構網絡結構的重構輸出端分別連接Loss層的損失函數輸入端,所述Loss層的損失函數輸出端連接優化函數計算層;
所述重構網絡結構包括依次連接的Reshape層、反卷積結構、Flatten層、和方差計算層,所述和方差計算層的方差輸入端分別連接Flatten層和輸入圖像的向量層,所述和方差計算層的方差輸出端連接Loss層的損失函數輸入端;
S2,輸入圖像訓練集合至所述膠囊網絡,所述膠囊網絡經訓練學習后完成圖像分類識別校準;
S3,輸入待分類圖像至所述膠囊網絡,所述工作網絡的輸出向量vj中數值最大的一個即為得到的識別結果;
S4,所述膠囊網絡輸出所述待分類圖像的識別結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西南大學,未經西南大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810509412.6/2.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





