[發(fā)明專利]基于核函數與稀疏編碼的高清圖像分類方法有效
| 申請?zhí)枺?/td> | 201310097406.1 | 申請日: | 2013-03-25 |
| 公開(公告)號: | CN103177265A | 公開(公告)日: | 2013-06-26 |
| 發(fā)明(設計)人: | 周凡;鄧偉財;盛建強 | 申請(專利權)人: | 中山大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 510006 廣東省廣州市番禺*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 函數 稀疏 編碼 圖像 分類 方法 | ||
技術領域
本發(fā)明涉及數字圖像處理領域,具體涉及一種基于核函數與稀疏編碼的高清圖像分類方法。
背景技術
目前,隨著計算機網絡的迅速發(fā)展、數字媒體技術及智能信息處理技術的發(fā)展和廣泛應用,大規(guī)模圖像資源不斷出現。面對著海量的圖像信息,如何對圖像進行分類或標注以便快速地、有效地從海量圖像數據中檢索出所感興趣的圖像已經人工智能和模式識別中的研究熱點,在科學研究、國防軍事、工業(yè)生產、航空航天、生物醫(yī)學、交通監(jiān)控等領域有著廣泛的應用。
傳統(tǒng)的方法是通過關鍵字對圖像進行人工標注,但這種方法是非常耗時的,并具有較大的主觀性,對于相同的圖像,不同的人可能產生不同的標注結果,因此這個方法在當今“信息災難”的時代是不可行的。
對圖像分類的研究的幾十年歷史,期間涌現了各種基于不同理論的分類方法,但是,該領域一直沒有形成一個統(tǒng)一的理論體系指導新的分類方法的設計與實現。近幾年來,圖像分類的常用方法包括統(tǒng)計方法和結構方法,但統(tǒng)計方法在圖像分類領域中表現活躍,產生了很多新的方法,如神經網絡方法、支持向量機(Support?Vector?Machine,SVM)方法及Boosting方法。根據實現方法的不同,統(tǒng)計方法可以分為:
1)非監(jiān)督分類法:又稱聚類分析法,根據模式之間的相似性進行類別劃分,將相似性強的模式劃分為同一個類別。該方法不需要對分類數據有較深入的了解,自適應地形成分類數據集,但分類效果在復雜數據中不太理想。
2)監(jiān)督分類法:根據預先已知類別的訓練樣本,得到各類在特征空間的分布規(guī)模,并利用這個分布規(guī)律對未知數據進行分類方法。該方法充分利用分類數據的先驗知識,并可通過反復檢驗訓練樣本,提高分類精度,因此該方法在高清圖像分類中廣泛應用。
目前支持向量機(SVM)廣泛應用于圖像分類領域并取得良好的分類效果,最早的支持向量機(SVM)方法是由Vapnik和Chervonenkis在“Support-Vector?Networks,Machine?Learning,20,1995.”一文中提出。支持向量機(SVM)是新型機器學習方法,具有完備的統(tǒng)計學習理論基礎,它采用結構風險最小化原則代替?zhèn)鹘y(tǒng)統(tǒng)計學中的基于大樣本的經驗風險最小化原則,克服了神經網絡受到網絡結構復雜性和樣本容量的影響大,容易出現過學習或低泛化能力的不足,對于小樣本數據分析具有出色的學習能力和推廣能力,在模式識別和函數估計中得到了有效的應用,但該方法仍存在以下問題:
(1)SVM方法對大規(guī)模訓練樣本難以實施,由于SVM是借助二次規(guī)劃來求解支持向量,而求解二次規(guī)劃將涉及m階矩陣的計算(m為樣本的個數),當m數目很大時該矩陣的存儲和計算將耗費大量的機器內存和運算時間。
(2)SVM方法的復雜度會隨特征個數的增加而快速增加,用來訓練分類器和測試結果的樣本數量會隨著特征的數量呈指數關系增長;若增加適應性不強的特征或者與已有特征有較強相關性的特征,反而會使分類器的分類能力下降,降低系統(tǒng)識別分類的能力。
發(fā)明內容
本發(fā)明的目的是對高清圖像提供一種分類方法,該方法能夠解決目前監(jiān)督分類方法的分類速度慢、復雜度隨著特征個數增加而指數增長、相關性不強的特征影響分類精度的問題。
本發(fā)明提供一種基于核函數與稀疏編碼的高清圖像分類方法,包括以下步驟:提取每張高清圖像的視覺特征;對視覺特征的歐氏空間進行核函數映射;根據變換后的視覺特征生成高清圖像類別的稀疏編碼;依據所述的高清圖像類別的稀疏編碼建立圖像非線性分類器,確定所述高清圖像所屬的類別。
較佳地,所述提取每張高清圖像的視覺特征包括:提取每張圖像的顏色、紋理、形狀、方向梯度直方圖、尺度不變特征轉換特征作為其視覺特征X=[X1,…,XK],其中,K為視覺特征的數量。
較佳地,所述對視覺特征的歐氏空間進行核函數映射包括:對所述的視覺特征進行核函數映射將視覺特征的歐氏空間變換成度量空間。
較佳地,所述根據變換后的視覺特征生成高清圖像類別的稀疏編碼包括:定義高清圖像相互間的線性表示為
定義高清圖像的重構誤差為
根據重構誤差最優(yōu)化和編碼盡量稀疏原則,確定高清圖像類別的稀疏編碼。
較佳地,所述根據重構誤差最優(yōu)化和編碼盡量稀疏原則,確定高清圖像類別的稀疏編碼的步驟包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中山大學,未經中山大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310097406.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種開關柜活門裝置
- 下一篇:非標準接口的連接部件





