[發明專利]一種基于觀測矩陣變換維度的圖像分類方法有效
| 申請號: | 201811473410.2 | 申請日: | 2018-12-04 |
| 公開(公告)號: | CN109657707B | 公開(公告)日: | 2020-12-25 |
| 發明(設計)人: | 葉心汝;王勇 | 申請(專利權)人: | 浙江大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 杭州天勤知識產權代理有限公司 33224 | 代理人: | 胡紅娟 |
| 地址: | 310013 浙江*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 觀測 矩陣 變換 維度 圖像 分類 方法 | ||
1.一種基于觀測矩陣變換維度的圖像分類方法,包括以下步驟:
(1)使用感知壓縮對圖像進行稀疏編碼,感知壓縮后的圖像組成數據集,將包含標簽標注的數據集劃分為訓練集和測試集;
所述使用感知壓縮對圖像進行稀疏編碼的方法包括圖像的稀疏表示、圖像壓縮采樣和圖像重構,所述的圖像稀疏表示為:
將原信號x在一組稀疏基Ψ上進行表示:
x = Ψs
其中,x為原信號,其大小為N×1,Ψ為一組稀疏基,s為稀疏系數;
所述圖像壓縮采樣的過程為設定或選取一個觀測矩陣,對圖像進行感知測量,所述觀測矩陣選自高斯分布的隨機觀測矩陣,圖像壓縮采樣后的信號表示為:
y=Θs
其中Θ=ΦΨ,Φ為觀測矩陣或稱測量基,大小為M×N;y的大小為M×1;
所述圖像重構包括通過限制矩陣Θ滿足有限等距性質,求解方程的最優解,得到重構后的原信號;
(2)構建包括輸入層、隱含層與輸出層的圖像分類網絡,所述隱含層為感知機單元;所述圖像分類網絡至少為兩個,分別包含不同節點數感知機單元;
(3)將步驟(1)中的訓練集作為輸入,在標簽的監督下,對步驟(2)構建的圖像分類網絡進行訓練,得到訓練完成后對應的神經網絡圖像分類模型;
(4)使用測試集驗證神經網絡圖像分類模型對圖像分類的準確率,選擇準確率最高的神經網絡圖像分類模型作為最終的神經網絡圖像分類模型;
(5)將待測圖像輸入步驟(4)得到的最終的神經網絡圖像分類模型,輸出圖像分類結果的預測概率。
2.根據權利要求1所述的基于觀測矩陣變換維度的圖像分類方法,其特征在于,在步驟(2)中,構建六個圖像分類網絡:
輸入層以經過步驟(1)感知壓縮的mnist手寫數字圖像作為輸入;感知機單元的節點數為50-300,步長為50;輸出層的節點個數為10,分別輸出圖像屬于每個類別的預測概率,選取預測概率的最高值對應的類別作為預測結果;組成六個包含不同節點數的圖像分類網絡;
在步驟(3)中,訓練完成后的圖像分類網絡所對應的神經網絡圖像分類模型為六個,其網絡結構中感知機單元的節點數分別為50、100、150、200、250和300。
3.根據權利要求1或2所述的基于觀測矩陣變換維度的圖像分類方法,其特征在于,在圖像分類網絡的訓練過程中,所述標簽進行獨熱編碼后轉化為10×1的向量,通過前向后向傳播算法對隱含層參數進行迭代調整。
4.根據權利要求3所述的基于觀測矩陣變換維度的圖像分類方法,其特征在于,使用測試集驗證六個神經網絡圖像分類模型對圖像分類的準確率,選擇準確率最高的神經網絡圖像分類模型作為最終的神經網絡圖像分類模型。
5.根據權利要求4所述的基于觀測矩陣變換維度的圖像分類方法,其特征在于,所述最終的神經網絡圖像分類模型中,感知機單元的節點數為200。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江大學,未經浙江大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811473410.2/1.html,轉載請聲明來源鉆瓜專利網。





