[發明專利]基于多特征融合的圖像場景分類方法在審
| 申請號: | 201611036315.7 | 申請日: | 2016-11-22 |
| 公開(公告)號: | CN106778768A | 公開(公告)日: | 2017-05-31 |
| 發明(設計)人: | 李志欣;李艷紅;張燦龍 | 申請(專利權)人: | 廣西師范大學 |
| 主分類號: | G06K9/46 | 分類號: | G06K9/46;G06K9/62 |
| 代理公司: | 桂林市持衡專利商標事務所有限公司45107 | 代理人: | 陳躍琳 |
| 地址: | 541004 廣西壯*** | 國省代碼: | 廣西;45 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 特征 融合 圖像 場景 分類 方法 | ||
技術領域
本發明涉及計算機圖像處理技術領域,具體涉及一種基于多特征融合的圖像場景分類方法。
背景技術
圖像理解(image understanding,IU)就是對圖像的語義理解。它是以圖像為對象,知識為核心,研究圖像中有什么目標、目標之間的相互關系、圖像是什么場景以及如何應用場景的一門學科。其中,圖像場景分類是圖像理解的一個分支。所謂圖像場景分類,就是自動判別一個語義類別集中的一幅圖像屬于哪個場景類(如海灘、森林和街道)。圖像場景分類技術一直以來備受人們的研究關注。已經在很多方面得到應用。雖然人們在提取特征方面取得很大的進步,但是由于光照、角度、尺度以及空間位置的影響,圖像場景分類仍然是一項具有挑戰的任務。
根據圖像描述方式的不同,當前圖像場景分類大體可分為基于全局特征和基于局部特征的分類。然而,由于圖像中包含的各種物體信息非常豐富,但彼此之間的空間分布錯綜復雜,基于全局特征或者基于局部特征的描述方法都會造成不可避免的錯分、誤分等現象。
發明內容
本發明所要解決的技術問題是現有圖像場景分類方法存在錯分、誤分的問題,提供一種基于多特征融合的圖像場景分類方法,其能夠在提升分類精度的同時,保證分類效率。
為解決上述問題,本發明是通過以下技術方案實現的:
基于多特征融合的圖像場景分類方法,包括如下步驟:
步驟1)樣本圖像的訓練階段;
1.1)同時提取樣本圖像的GIST特征、SIFT特征和PHOG特征;
1.2)對樣本圖像的SIFT特征進行局部約束線性編碼,得到樣本圖像的SIFT特征稀疏編碼;
1.3)樣本圖像的SIFT特征稀疏編碼經池化處理后得到樣本圖像的SIFT特征稀疏向量;
1.4)將樣本圖像的GIST特征、SIFT特征稀疏向量和PHOG特征進行級聯后形成樣本圖像的最終特征表示,并將樣本圖像的最終特征表示輸入線性分類器訓練;
步驟2)待分類圖像的分類階段;
2.1)同時提取待分類圖像的GIST特征、SIFT特征和PHOG特征;
2.2)對待分類圖像的SIFT特征進行局部約束線性編碼,得到待分類圖像的SIFT特征稀疏編碼;
2.3)待分類圖像的SIFT特征稀疏編碼經池化處理后得到待分類圖像的SIFT特征稀疏向量;
2.4)將待分類圖像的GIST特征、SIFT特征稀疏向量和PHOG特征進行級聯后形成待分類圖像的最終特征表示,將待分類圖像的最終特征表示輸入步驟1.4)訓練好的線性分類器進行判別,確定該幅待分類圖像屬于哪一類。
上述步驟1.3)和步驟2.3)中,所述池化處理是基于基于空間金字塔匹配框架的池化處理。
上述步驟1.1)和步驟2.1)中,GIST特征提取的過程為:首先將圖像和不同方向與不同尺度的Gabor濾波器組進行濾波,然后把濾波后的圖像劃分成網格,在每一個網格內部取平均值,最后按行組合把所有的網格均值級聯起來。
上述步驟1.1)和步驟2.1)中,SIFT特征提取的過程包括:構建尺度空間,極值點檢測,特征點定位,計算特征點方向,以及生成SIFT特征描述符這5個步驟。
上述步驟1.1)和步驟2.1)中,PHOG特征提取的過程為:首先得到圖像的部分或全部輪廓;然后計算輪廓點處的梯度模和梯度方向,并再將梯度方向轉換成以度為單位后分成K個區間,在各區間上累加梯度模的值作為該區間的權值,得到梯度方向直方圖;接著將一幅圖像逐級分割細化;最后計算每一級各塊所含邊緣點對應的梯度方向直方圖,將所有這些梯度方向直方圖連接起來;上述K為正整數。
與現有技術相比,本發明具有如下特點:
(1)利用GIST特征對圖像產生一個綜合的認知,綜合描述了自然度、開放度、粗略度、展開度和崎嶇度五種自然屬性,相比較傳統的場景分類方法可以避免了根據各種實際情況設置各種參數和門限。
(2)在特征學習過程中融合了GIST、SIFT跟PHOG特征的各自的優點,能夠起到特征之間的優勢互補,因而能夠在一種特征不能詳細描述圖像的情況下,取得更好的分類精度。
(3)對于輸入圖像視覺特征的學習采用稀疏編碼,對于圖像的特征之間空間關系采用SPM框架進行池化,能夠對高維向量起到有效的降維作用。
(4)LLC的編碼速度快,效率高,為線性分類提供了基礎。分類時使用線性分類器能大大縮短訓練時間。在提高分類精度的同時,又增強了系統的魯棒性。
附圖說明
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣西師范大學,未經廣西師范大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611036315.7/2.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





