[發(fā)明專利]基于核空間的深度散射卷積網(wǎng)絡學習方法和系統(tǒng)在審
| 申請?zhí)枺?/td> | 201610035416.6 | 申請日: | 2016-01-19 |
| 公開(公告)號: | CN105718944A | 公開(公告)日: | 2016-06-29 |
| 發(fā)明(設計)人: | 熊紅凱;熊岳涵 | 申請(專利權)人: | 上海交通大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 上海漢聲知識產(chǎn)權代理有限公司 31236 | 代理人: | 徐紅銀;郭國中 |
| 地址: | 200240 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 空間 深度 散射 卷積 網(wǎng)絡 學習方法 系統(tǒng) | ||
技術領域
本發(fā)明涉及一種數(shù)字圖像分類方案,具體是一種基于核空間的深度散射卷積網(wǎng)絡 學習方法和系統(tǒng)。
背景技術
數(shù)字圖像信號的分類問題通常由特征提取算子及分類器聯(lián)合解決。特征提取算子 提取的特征識別類內(nèi)相似性并區(qū)分類間差異性的能力稱為特征可分性,這種性質(zhì)顯然 影響著分類精度。在特征提取算子確定的情況下,特征可分性受到后端的分類器的影 響。為了進一步提高信號的分類準確率,一種方案是聯(lián)合優(yōu)化特征提取算子和分類 器,這種方案可以提供對不同類型的數(shù)字圖像進行分類的魯棒性。
經(jīng)過對現(xiàn)有技術的文獻檢索發(fā)現(xiàn),J.Bruna和S.Mallat在2013年的《IEEE TransactionsonPatternAnalysisandMachineIntelligence》(TPAMI)期刊上發(fā)表的 “Invariantscatteringconvolutionnetworks”一文中提出了一種基于復小波分解的散射卷 積網(wǎng)絡,該散射網(wǎng)絡通過級聯(lián)小波卷積、非線性取模及局部平均算子建立了一種能線 性化細微形變且有局部平移不變特性的特征提取算子。該方法可以有效提高紋理圖像 和手寫字符的分類準確率,但這種方法沒有考慮后端分類器對散射網(wǎng)絡的特征可分性 的影響,且給出小波的旋轉和伸縮數(shù),網(wǎng)絡中散射路徑的數(shù)量和參數(shù)是固定的,這導 致對于特定的問題分類準確率降低。M.Sangnier,J.Gauthier與A.Rakotomamonjy在 2015年的《SignalProcessing》期刊上發(fā)表的“Filterbanklearningforsignal classification”一文中提出了一種聯(lián)合學習濾波器組和支持向量機的方法,該方法將濾 波器組的學習問題轉化為多核學習問題,可以在高噪聲水平下有效地解決音頻信號的 二元分類問題。但這種方法只解決單層濾波器組的學習問題,所得的信號分解系數(shù)不 包含不同尺度和方向之間的交互信息,最終會導致圖像信號的分類不準確。這些不足 促使申請人找到一種深度卷積網(wǎng)絡的學習方法,針對不同的圖像數(shù)據(jù)庫自適應地學習 網(wǎng)絡中的卷積路徑。
發(fā)明內(nèi)容
本發(fā)明針對現(xiàn)有技術的不足,提供了一種基于核空間的深度散射卷積網(wǎng)絡學習方 法及系統(tǒng),針對不同的圖像數(shù)據(jù)庫能自適應地學習網(wǎng)絡中的卷積路徑,可以有效提高 手寫字符和紋理圖像的識別準確率,并可作為一種通用的數(shù)字圖像分類方法。
本發(fā)明是通過以下技術方案實現(xiàn)的:
本發(fā)明提供一種基于核空間的深度散射卷積網(wǎng)絡學習方法,包括:
參數(shù)化小波生成步驟:該步驟以隨機化參數(shù)構造小波濾波器組;
多核學習步驟:該步驟基于參數(shù)化小波生成步驟構造的小波濾波器組對訓練數(shù)據(jù) 集進行散射卷積網(wǎng)絡的分解,并采用多核學習算法選擇最優(yōu)卷積路徑;
散射分解步驟:該步驟基于多核學習步驟選擇的最優(yōu)卷積路徑對測試數(shù)據(jù)集進行 散射分解,所得的分解系數(shù)在支持向量機分類被分類。
進一步的,所述的參數(shù)化小波生成步驟:通過隨機化的變換參數(shù)對復小波基進行 伸縮及旋轉變換構造小波濾波器組。
進一步的,所述的多核學習步驟:基于最大化間距準則和一對多策略聯(lián)合優(yōu)化散 射卷積網(wǎng)絡與支持向量機,并將該聯(lián)合優(yōu)化問題轉化為多核學習問題。
進一步的,所述的多核學習步驟,具體實現(xiàn)如下:
S1、更新參數(shù)化小波生成步驟的隨機化參數(shù),構造小波濾波器組對訓練數(shù)據(jù)集進 行散射卷積網(wǎng)絡的分解,用分解結果中每條卷積路徑的系數(shù)分別構建高斯核;
S2、通過廣義多核學習算法計算當前高斯核集合中每個核的組合權值,基于活動 集準則去除集合中權值為零的非活動核,并計算加權積形式的組合核;
S3、重復S1,結合所得的新生成的高斯核與S2中得到的組合核,計算當前解是 否滿足KKT(Karush-Kuhn-Tucker)條件,若滿足則根據(jù)S2中的高斯核集合推導對應 的卷積路徑,作為局部最優(yōu)解輸出;否則在新生成的高斯核中選出一個違背KKT條件 的核以零初始權值加入S2選出的活動核集合中,并轉到S2。
進一步的,所述的散射卷積網(wǎng)絡的分解,是指:由小波濾波器組迭代地對信號進 行卷積分解,每條卷積分解路徑有不同的小波伸縮或旋轉參數(shù)且卷積次數(shù)m≤2,每 次卷積后進行復數(shù)取模操作,最后進行高斯低通濾波,結果為該卷積路徑的分解系 數(shù)。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海交通大學,未經(jīng)上海交通大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610035416.6/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。





