[發明專利]基于級聯式碼本生成的圖像分類方法有效
| 申請號: | 201010112508.2 | 申請日: | 2010-02-12 |
| 公開(公告)號: | CN102156885A | 公開(公告)日: | 2011-08-17 |
| 發明(設計)人: | 張琳波;肖柏華;王春恒;張榮國;蔡新元 | 申請(專利權)人: | 中國科學院自動化研究所 |
| 主分類號: | G06K9/66 | 分類號: | G06K9/66 |
| 代理公司: | 中科專利商標代理有限責任公司 11021 | 代理人: | 梁愛榮 |
| 地址: | 100080 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 級聯 生成 圖像 分類 方法 | ||
技術領域
本發明屬與模式識別與信息處理技術領域,涉及一種基于級聯式碼本生成的圖像分類方法,具體的是一種圖像分類方法。
背景技術
由于數碼相機等數碼產品的低廉價格,圖片、視頻數據可以很方便的拍攝并保存成方便計算機處理的電子形式。同時,互聯網資源的迅猛發展,使得廣大用戶開始面臨一個龐大的數據資源。單純的利用人力來維護和組織這些數據已經變得不現實。因此,開發一種技術來有效的組織這些個人或者企業圖片、視頻數據成為了一個熱點問題。然而,計算機不能“看”的很清楚:它們不能像人一樣把圖像中的顏色像素轉換為更高級語義表示形式,進而完成分類整理。
一個人可以分類識別10,000多種視覺對象。對我們人類來說,分類過程很快,毫不費力而且對視角、光亮、遮擋和背景混淆有很好的魯棒性。而且,這個過程僅需要很少的監督和少量實例。經過了幾十年的努力,研究者在特定目標(如,人臉,指紋識別)分類識別方面取得了很大進展,但是,到目前為止還沒有開發出一種通用的目標識別技術,滿足人們日常生活的需要。如何訓練計算機來模擬人的形象思維,達到人類的識別能力,仍然面臨著極大的挑戰。是挑戰,也是機會,因為這意味著這個領域還有著很大的發展空間。
圖像分類的研究,大致可以追溯到60年代。在這個過程當中,圖像分類研究者在這個領域做出了大量工作,其中包含很多具有里程碑意義的方法??偟膩碚f,目前圖像分類主要可以分為兩個流派:其中之一是模仿人類的視覺器官,建立對應的分類子單元,以提高模仿程度來提高分類性能;另外一種就是模仿人類視覺的功能,而不刻意關注人實現過程中物理器官的反應。1964年,Neisser在中指出,人類的視覺系統的分類過程大致可以分為兩個階段:意識前階段和意識階段。在意識前階段,目標上的突出的顯著局部區域會首先捕獲人的注意力;在意識階段,人們的視覺系統開始建立這些顯著部分的關系,進而識別出目標。這思路極大的影響了計算機視覺界(主要是通過馬爾的工作),一系列有效的研究紛至沓來。與Neisser提出的意識前階段和意識階段的功能相對應,目標識別的過程大致可以分為兩個階段:局部顯著區域檢測及描述和分類模型。在局部顯著區域檢測中,SIFT(尺度不變特征變換)以其穩定的性能,成為了局部顯著區域檢測和描述的首選。同時,為了組織這些局部顯著區域以形成圖像的向量化描述,產生了一系列的分類模型,有部分-結構模型,基于輪廓的模型,語境語義相關模型,仿生學模型,特征包模型。在這些模型當中,特征包模型以其優越的性能,簡潔的計算方式,成為圖像分類的主流模型。
然而,特征包模型需要產生一個可供所有圖像局部區域映射的碼本。為了滿足這個需要,理想中的碼本應該涵蓋所有可能的局部顯著區域圖像塊。但是,圖像的變化時多樣且連續的,我們不可能生成一個碼本,能夠涵蓋所有的圖像塊。為了能夠近似的逼近圖像塊的各種變化,研究者選擇了聚類的方式,把多種類似的局部顯著區域圖像塊的連續變化映射到中間某個典型的圖像快上面。隨著圖像數目的增加,這種典型的局部區域圖像塊也會呈亞線性增長,由此帶來的便是圖像表示向量維數的增加,進而導致維數災難。如何產生碼本,使它既能滿足多樣性的要求,又在一定程度上避免維數災難,成了目前困擾特征包模型研究者的熱點問題。同時,對于特定類別分類問題,如果按照普通的分類方法,每個分類器的訓練過程,需要以本類別的訓練圖像為正樣本,其他所有訓練圖像作為負樣本,這樣就造成了分類器訓練中嚴重的樣本不均衡問題,使得正樣本淹沒在負樣本當中。為了解決這個問題,有的研究者采用減少負樣本的方法,但是,由于減少了負樣本的多樣性,使得大量的負樣本被誤分為正,分類器的性能反而大大降低。同時有的研究者采用將負樣本分為幾部分,每一部分與正樣本訓練一個分類器,然后將所有分類器的輸出結果按照少數服從多數的投票方式,決定圖像的分類結果;然而此方式沒有認識到正樣本淹沒在負樣本中的根本原因并不是負樣本多,而是正負樣本的固定的映射空間本身具有一定的不可分性,而僅僅把負樣本分為幾部分并不是解決問題的關鍵,因此雖然采用負樣本分塊訓練分類器后投票的方法在一定程度上提高了性能,但是也沒有從根本上解決問題。
發明內容
為了解決現有技術對多類別分類問題存在的困難,本發明的目的是提供一種既能夠集合類別之間的具有判別力的局部顯著區域圖像塊作為碼本,又能有效的降低分類中向量表示的維數災難問題的解決方法。同時避開樣本不均衡問題。
為了達成所述目的,本發明采用基于級聯式的碼本生成的圖像分類方法,該圖像分類方法包括步驟如下:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院自動化研究所,未經中國科學院自動化研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010112508.2/2.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





