[發明專利]基于非負矩陣分解和卷積神經網絡的彩色圖像處理方法在審
| 申請號: | 201810161883.2 | 申請日: | 2018-02-27 |
| 公開(公告)號: | CN108491863A | 公開(公告)日: | 2018-09-04 |
| 發明(設計)人: | 張小瑞;吳韻清;孫偉;宋愛國;牛建偉 | 申請(專利權)人: | 南京信息工程大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 南京匯盛專利商標事務所(普通合伙) 32238 | 代理人: | 張立榮 |
| 地址: | 210044 江*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 卷積神經網絡 彩色圖像處理 非負矩陣 重構 彩色圖像 預處理 讀取圖像數據 提取圖像特征 矩陣 分解 采集設備 分解算法 分類效率 特征提取 圖像處理 圖像分類 初始化 列數 行數 光滑 分類 優化 | ||
本發明涉及一種基于非負矩陣分解和卷積神經網絡的彩色圖像處理方法,該方法用采集設備獲取彩色圖像并進行預處理,設有采用非光滑非負矩陣分解算法提取圖像特征、結合卷積神經網絡優化彩色圖像分類和重構過程,包括首先讀取圖像數據矩陣,得到其行數、列數,初始化相應參數;然后結合卷積神經網絡,依步驟完成圖像分類和重構;本發明的圖像處理方法在彩色圖像處理過程中特征提取更精確,重構錯誤少,分類效率高。
技術領域
本發明專利涉及人工智能領域的圖像處理,尤其涉及基于非負矩陣分解的卷積神經網絡的彩色圖像處理方法,屬于計算機視覺、虛擬現實技術領域。
背景技術
圖像是人類獲取、表達、傳遞信息的重要手段。近20年來,隨著計算機技術和電子技術的迅猛發展,彩色圖像處理的研究不斷深入。深度學習在圖像識別、自動語音識別和自然語言處理領域受到越來越多的關注,但仍存在過度擬合、計算時間過長、分類精度不高等諸多問題。
發明內容
本發明為了解決現有技術中存在的問題,提供一種通過使用非負矩陣分解算法(NMF)研究彩色圖像,在了解和識別對象過程中提供的重要信息來幫助卷積神經網絡(CNN)學習特征的分類精度高的圖像處理方法。
為了達到上述目的,本發明提出的技術方案為:一種基于非負矩陣分解和卷積神經網絡的彩色圖像處理方法,包括以下步驟:
步驟1、圖像預處理
1.1將彩色圖像的像素值歸一化,并將圖像表示為數據矩陣,所述數據矩陣包括表示紅、綠、藍三種顏色的子數據矩陣;
1.2將原彩色圖像集中的每個彩色圖像進行劃分,得到若干子補丁,并從中隨機抽樣,得到待學習特征的子補丁集;
步驟2、學習彩色圖像顏色特征
2.1采用RGB每個或RGB所有學習方式學習圖像顏色特征,所述RGB每個和RGB所有為卷積神經網絡的兩種學習方式,RGB每個方式分別處理三種顏色通道信息,RGB所有方式同時處理三種顏色通道信息;
2.2采用非光滑的非負矩陣分解算法學習顏色特征
RGB每個方式中,采用標準非負矩陣分解算法將步驟1的數據矩陣分解為標準基矩陣和標準特征系數矩陣,采用非光滑非負矩陣分解算法將稀疏特征矩陣引入標準基矩陣,對上述標準特征系數矩陣進行平滑,得到更新的特征系數矩陣和更新的基矩陣,然后連接三種顏色的更新的特征系數矩陣的列方向得到分類器的輸入向量;
RGB所有方式中,將來自3種顏色的數據矩陣進行堆疊,作為分類器的輸入向量,采用非光滑的非負矩陣分解算法學習子補丁集,得到k維特征向量f(x);
步驟3、基于卷積神經網絡的彩色圖像分類
3.1設原彩色圖像大小為a×a,將圖像提取為大小為p×p的子圖像,將步驟2得到的更新的特征系數矩陣或特征向量,用z個學習特征進行卷積;形成z×(a-p+1)×(a-p+1)個圖像,完成特征映射,得到特征圖;
3.2計算子圖像中的最大或平均值作為子圖像的值,將特征圖無重疊地構建成合并圖,完成平均池化聚合后,子圖像被連接以形成尺寸減小的特征;
3.3使用分類器,串聯合并圖,形成每個圖像對應的矩陣,完成分類;
步驟4、基于卷積神經網絡的彩色圖像重構
4.1定義標簽向量集為其中,是從原彩色圖像集得到的第i個特征;l(i)是第i個標簽類,b是訓練樣本數,為正整數;若圖像具有第i個特征,該圖像對應的第i個標簽類是1,否則是0;
4.2局部特征提取
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京信息工程大學,未經南京信息工程大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810161883.2/2.html,轉載請聲明來源鉆瓜專利網。





