[發明專利]基于稀疏編碼預訓練的卷積神經網絡圖像分類方法在審
| 申請號: | 201811157807.0 | 申請日: | 2018-09-30 |
| 公開(公告)號: | CN109344898A | 公開(公告)日: | 2019-02-15 |
| 發明(設計)人: | 劉芳;吳志威;路麗霞;王鑫;王洪娟;楊安喆 | 申請(專利權)人: | 北京工業大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 北京思海天達知識產權代理有限公司 11203 | 代理人: | 沈波 |
| 地址: | 100124 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 圖像分類 訓練樣本 卷積神經網絡 算法學習 稀疏編碼 初始化 卷積核 灰度 圖像 底層視覺特征 低頻子帶 分類效果 局部特征 隨機選擇 統計特性 網絡訓練 下采樣 原圖像 準確率 兩層 排序 場景 分解 | ||
1.基于稀疏編碼預訓練的卷積神經網絡圖像分類方法,其特征在于:具體包括以下步驟:
S1:首先對圖像數據集中的訓練樣本進行非下采樣Contourlet變換,對訓練樣本中的原圖像進行多尺度分解,并選取前兩層分解圖像來擴充圖像數據集;
S2:將圖像數據集中的圖像裁剪成與卷積核尺寸相同的圖像塊patches,卷積核尺寸為patchDim{1,3,5},利用稀疏編碼算法學習局部特征,得到圖像的超完備基向量;
S3:計算S2中基向量灰度平均梯度值,并對特征向量按照灰度平均梯度從大到小進行排序;
S4:選擇灰度平均梯度大的特征向量對卷積神經網絡的卷積核進行初始化,然后將樣本圖像輸入到CNN網絡中進行訓練,逐層對圖像樣本特征學習并得到全局特征響應的待分類圖像特征集;
S5:將得到的待分類圖像特征集輸入到支持向量機,進行圖像分類并得到分類準確率。
2.根據權利要求1所述的基于稀疏編碼預訓練的卷積神經網絡圖像分類方法,其特征在于:S1:首先對訓練樣本進行非下采樣Contourlet變換,對原圖像進行多尺度分解,并選取前兩層分解圖像來擴充圖像數據集;
非下采樣Contourlet變換是由非下采樣塔形分解和非下采樣方向濾波器分解兩部分組成;首先通過非下采樣金字塔分解,獲得與拉普拉斯金字塔分解類似并且具有平移不變性的濾波器結構,是一個多尺度性的變化過程,通過這組濾波器,圖像被分解為一個低頻子帶和一個高頻子帶,要實現多級結構,此后每一級對低頻子帶迭代濾波即可;其次是非下采樣方向濾波器組再進行方向上的分解,是將非下采樣金字塔產生的高頻帶通信號分解到多個方向子帶上,得到的變換具有多方向性;
S2:將圖像數據集中的圖像裁剪成與卷積核尺寸相同的圖像塊patches,其中卷積核尺寸為patchDim{1,3,5},利用稀疏編碼算法學習局部特征,得到圖像的超完備基向量;稀疏編碼算法主要分為以下兩個步驟:
S2.1:訓練階段;給定樣本圖像數據集[x1,x2,....,xn],從這些樣本圖像中學習的到一組基向量[φ1,φ2,....,φk];訓練過程就是一個重復迭代的過程,為得到超完備基向量,需要使如下公式所示的目標函數最小,方法是通過更替的更改a和φ的值使得目標函數最小;
其中,k是基向量的個數,n是圖像樣本的個數,且k>n,x為樣本圖像數據,φ表示的是從樣本中學習到的基向量,a為稀疏系數,常量λ是一個變換量,由常量λ來控制這兩項式子的相對重要性;
即迭代過程分為以下兩步驟:
步驟1)先固定φk,然后不斷調整ak,使得目標函數最小;
步驟2)然后固定ak,再不斷調整φk,使得目標函數最小;
通過不斷迭代即重復步驟1)和步驟2),直到函數收斂,就得到一組表示樣本圖像的基向量;
S2.2:編碼階段;輸入一個新的圖像,通過上面的訓練階段得到基向量,然后帶入目標函數中,求解目標函數中的稀疏向量,這個稀疏向量就是輸入圖像的一個稀疏表達;
假設CNN的輸入訓練圖像數據集含有N幅大小為m×s的訓練圖像,Ii表示為輸入訓練圖像數據集中第i副圖像,CNN卷積核是大小為k1×k2的二維矩陣,二維矩陣中的數據是對感受野中數據處理的系數,一個卷積核的濾波可以用來提取特定的特征;訓練圖像Ii被分成k1×k2大小的圖像塊,這些圖像塊表示為其中,xi,z表示圖像Ii中第z個圖像塊;那么,圖像Ii的圖像塊數據為:
Xi=[xi,1,xi,2,...,xi,ms]
同理,訓練圖像的圖像塊數據為:
利用上述公式求出超完備基向量,那么,SC算法學習到特征向量作為CNN初始化的卷積核組Wln表示為:
其中,表示將向量映射到φl表示圖像塊X的l個超完備基向量;
S3:計算S2中基向量灰度平均梯度值,并對特征向量按照灰度平均梯度從大到小排序;灰度平均梯度不僅能夠用來評價圖像的清晰度,還能反映出圖像中微小細節反差的變化和紋理特征信息;
如果將SC非監督學習得到的超完備基向量φ中每個基向量φl的p×p數據看作一幅圖像,用梯度信息來衡量其特征學習的效果,因為灰度平均梯度值越大,紋理特征越好,表示圖像越清晰;反之就越模糊;通過灰度平均梯度值對超完備基向量進行從大到小排序,按照特征邊緣性強弱排序,然后再根據實際問題中卷積核大小和數量對基向量進行選擇;基向量的灰度平均梯度為:
其中,GMG為圖像的灰度平均梯度值,φl(i,j)表示圖像矩陣中第i行、第j列的像素灰度值,p表示圖像矩陣的行數;
從SC非監督學習的基向量的灰度平均梯度中選擇最大值作為這些基向量從大到小排序顯示的指標,即將學習的字典中每個基向量按照其灰度平均梯度從大到小的順序排列,排序指標為:
mGMG(φl)=max GMG(φl)
S4:選擇灰度平均梯度較大的特征向量對卷積神經網絡的卷積核進行初始化,然后將樣本圖像輸入到CNN網絡中進行訓練,逐層對圖像樣本特征學習并得到全局特征響應。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京工業大學,未經北京工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811157807.0/1.html,轉載請聲明來源鉆瓜專利網。





