[發(fā)明專利]基于壓縮感知多核學習的圖像分類方法及其裝置有效
| 申請?zhí)枺?/td> | 201310285254.8 | 申請日: | 2013-06-30 |
| 公開(公告)號: | CN103514456B | 公開(公告)日: | 2017-04-12 |
| 發(fā)明(設計)人: | 吳金勇;陳先開 | 申請(專利權)人: | 安科智慧城市技術(中國)有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06K9/46 |
| 代理公司: | 深圳市華優(yōu)知識產(chǎn)權代理事務所(普通合伙)44319 | 代理人: | 周丹 |
| 地址: | 518034 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 壓縮 感知 多核 學習 圖像 分類 方法 及其 裝置 | ||
技術領域
本發(fā)明涉及監(jiān)控視頻中的圖像分類,尤其涉及一種基于壓縮感知多核學習的圖像分類方法及其裝置。?
背景技術
隨著社會和經(jīng)濟的發(fā)展,城市的智慧化已經(jīng)得到了長足的發(fā)展,監(jiān)控攝像頭已經(jīng)幾乎遍布了城市的所有角落。隨之導致的問題是監(jiān)控視頻數(shù)據(jù)的指數(shù)增長。而從中挖掘有效信息越發(fā)困難。對監(jiān)控視頻數(shù)據(jù)進行分析并分類是智能分析中最重要研究內(nèi)容之一,監(jiān)控數(shù)據(jù)的分類有著重要的應用價值,如監(jiān)控視頻中的行人、車輛類別、車輛顏色和行人衣著分類等,它可以有效地提高海量數(shù)據(jù)的檢索效率,從而降低人力成本。目前,大部分的圖像數(shù)據(jù)分類方法主要包括數(shù)據(jù)收集、圖像預處理、特征提取、模型學習和模型預測模塊。分類精度主要取決于特征提取和模型學習兩個模塊。當前特征提取的方法主要是基于顏色、紋理特征或輪廓特征進行:顏色特征方面主要有顏色直方圖和像素值等;紋理特征主要有基于局部二值模式;輪廓特征主要有梯度直方圖和梯度差分等。模型學習方法主要有如adaboost、svm、決策樹、神經(jīng)網(wǎng)絡、貝葉斯和高斯過程等。傳統(tǒng)的分類方法主要是提取某種特征作為表觀,如顏色、紋理和輪廓,然后利用分類器學習得到一個分類模型,實際中,待分類的目標往往都是同時擁有顏色、紋理和輪廓的特征。由此會導致特征表達不準確,進而致使分類器的魯棒性差和分類精度低。因此現(xiàn)有的基于單一特征的分類器方法往往無法滿足實際中的分類要求,需要一種基于多特征的分類器。?
發(fā)明內(nèi)容
針對現(xiàn)有技術的缺點,本發(fā)明的目的是提供一種能有效提高魯棒性和分類精確度的壓縮感知多核學習的圖像分類方法及其裝置。?
為實現(xiàn)上述目的,本發(fā)明的實施例提供一種基于壓縮感知多核學習的圖像分類方法,包括以下步驟:(1)字典學習:對訓練樣本集中的每張圖片分別隨?機采樣多張子圖像,根據(jù)隨機函數(shù)生成多個隨機整數(shù),隨后生成多組子圖像,對每張子圖像分別提取關于顏色、紋理和輪廓的特征,并且利用聚類算法來分別構造關于顏色、紋理和輪廓的字典;(2)特征提取:提取訓練樣本集中的每張圖片的顏色、紋理和輪廓特征,根據(jù)字典構造KD樹從而分別計算圖片的顏色特征直方圖、紋理特征直方圖和輪廓特征直方圖并由此生成對應的三個特征集合;(3)特征降維:生成稀疏隨機矩陣并且對圖片的顏色、紋理和輪廓特征進行特征降維操作,從而得到對應的低維度的特征;(4)分類器學習:將樣本的降維處理后的顏色、紋理和輪廓的三個低緯度特征向量進行順序拼接,形成一個新的特征集合,并使用基于最小二乘多核的分類器在訓練集上學習模型;以及(5)圖像類別預測:對于一張待分類的圖片,首先根據(jù)所述特征提取步驟而提取圖像的特征,接著根據(jù)所述特征降維步驟而計算得到低維度的特征,再拼接降維后的特征向量而形成新的特征,將該新的特征代入訓練好的分類器模型,從而得到圖像類別的輸出結果。?
其中,在所述步驟(1)中,字典學習的具體方法為:?
對訓練樣本集D中的每張圖片Ii,i=1,L,l分別隨機采樣T張子圖像,記為Pi={pi1,L,piT};?
根據(jù)隨機函數(shù)randx和randy,生成T個隨機整數(shù),分別記為{rx1,L,rxT}和{ry1,L,ryT},randx和randy均為服從等概率分布的隨機數(shù)生成器,隨機數(shù)生成的范圍分別是{0,1,L,w-16}和{0,1,L,h-16};?
將子圖像pit,t=1,L,T的所有像素值設為0,對于pit的每個像素進行賦值,即pit(c,r)=Ii(c+rxt,r+ryt),由此生成了T組子圖像Pi={pi1,L,piT};?
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于安科智慧城市技術(中國)有限公司,未經(jīng)安科智慧城市技術(中國)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310285254.8/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。





