[發明專利]一種基于組稀疏編碼的圖像特征學習方法有效
| 申請號: | 201611036079.9 | 申請日: | 2016-11-09 |
| 公開(公告)號: | CN106778808B | 公開(公告)日: | 2020-09-08 |
| 發明(設計)人: | 汪冬冬;李岳楠 | 申請(專利權)人: | 天津大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06K9/66 |
| 代理公司: | 天津市北洋有限責任專利代理事務所 12201 | 代理人: | 李林娟 |
| 地址: | 300072*** | 國省代碼: | 天津;12 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 稀疏 編碼 圖像 特征 學習方法 | ||
本發明公開了一種基于組稀疏編碼的圖像特征學習方法,涉及信號與信息處理技術領域,包括:將輸入的圖像分割成具有固定大小的圖像塊,并且按圖像塊空間位置分組,利用組稀疏編碼獲得每個組的圖像塊的稀疏描述;對各個組的稀疏描述進行池化,得到池化后的稀疏描述;將獲得的稀疏描述再次按對應圖像塊空間位置分組,利用組稀疏編碼獲得每個組的稀疏描述;再次對各個組的稀疏描述進行池化,得到池化后的稀疏描述。本方法能夠提取圖像的慢變視覺特征,計算復雜度低;且提取出的特征魯棒性強,復雜度低,模擬了人眼的視覺特性,可實現高效、準確的圖像內容識別。
技術領域
本發明涉及信號與信息處理技術領域,尤其涉及一種基于組稀疏編碼的圖像特征學習方法。
背景技術
人眼的視覺特性具有稀疏、分層、慢變的特征。因此通過分層的結構學習出稀疏、慢變的圖像特征來模擬人眼的視覺特性具有重要意義。慢變特征就是基于慢原則而來,人眼所注意的重要特性往往是慢變的:輪廓、環境以及重要目標本身等等。慢變特征也具有更魯棒的性質。因此,用什么樣的模型來學習慢變特征是慢變特征學習的關鍵技術。
時域慢變特征的學習上:文獻[1]中Mobahi等采用基于CNN和視頻時域相關性學習慢變特征,文獻[2]中Bergstra等采用基于復雜類細胞網絡學習慢變特征。空域慢變特征的學習中,編碼與字典學習是關鍵,文獻[3]中Bengio等人提出組稀疏編碼,并使用混合范數,提高了字典原子的使用率。
發明人在實現本發明的過程中,發現現有技術中至少存在以下缺點和不足:
傳統的手工特征提取往往只針對某個方面,而且需要先驗知識。這不符合人眼的視覺特性。而且需要先驗知識也增加很多局限,需要人工標注,費時費力。傳統的稀疏編碼方法由于不能保證其每個視覺描述子都能對整幅圖片稀疏編碼,因此在大尺寸圖片的應用中往往會受到空間和時間資源的限制。
發明內容
本發明提供了一種基于組稀疏編碼的圖像特征學習方法,本發明從圖像中學習慢變特征,該特征可以反映圖片在空間上變化慢的重要信息,反映各個尺度的內在特征,同時具有良好的魯棒性和區分性,據此可應用于目標識別或者圖像和視頻的搜索等領域,詳見下文描述:
一種基于組稀疏編碼的圖像特征學習方法,所述方法包括以下步驟:
將輸入的圖像分割成具有固定大小的圖像塊,并且按圖像塊空間位置分組,利用組稀疏編碼獲得每個組的圖像塊的稀疏描述;
對各個組的稀疏描述進行池化,得到池化后的稀疏描述;
將獲得的稀疏描述再次按對應圖像塊空間位置分組,利用組稀疏編碼獲得每個組的稀疏描述;
再次對各個組的稀疏描述進行池化,得到池化后的稀疏描述。
其中,所述將輸入的圖像分割成具有固定大小的圖像塊并且按圖像塊空間位置分組,利用組稀疏編碼獲得每個組的圖像塊的稀疏描述具體為:
1)沿水平和垂直方向將圖像分割為N個固定大小的圖像塊,并將圖像塊轉化為一維向量;按照圖像塊空間位置,將水平和垂直方向上鄰近的N/M個塊分為一組,共分為M個組;
2)對于集合中的每一個組,根據組稀疏編碼字典,依次對組進行稀疏編碼。
其中,所述依次對組進行稀疏編碼具體為:
式中,重構矩陣由向量組成,其中R表示實數空間;為與αj維數相同的矢量;λ,β為常數;集合G稱為組;|G|表示組中的圖塊向量數目,其值為N/M;為向量αj的第i個元素;dj為組稀疏編碼字典中的第j(1≤j≤K)個原子,K表示字典原子個數,本發明實施例并不限制具體的字典生成方法及其原子個數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于天津大學,未經天津大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611036079.9/2.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





