[發(fā)明專利]圖像分類方法及系統(tǒng)在審
| 申請(qǐng)?zhí)枺?/td> | 201410177159.0 | 申請(qǐng)日: | 2014-04-29 |
| 公開(kāi)(公告)號(hào): | CN103942570A | 公開(kāi)(公告)日: | 2014-07-23 |
| 發(fā)明(設(shè)計(jì))人: | 雷柏英;陳思平;汪天富;倪東 | 申請(qǐng)(專利權(quán))人: | 深圳大學(xué) |
| 主分類號(hào): | G06K9/62 | 分類號(hào): | G06K9/62 |
| 代理公司: | 深圳市科進(jìn)知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 44316 | 代理人: | 宋鷹武;沈祖鋒 |
| 地址: | 518000 廣東*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 圖像 分類 方法 系統(tǒng) | ||
技術(shù)領(lǐng)域
本發(fā)明涉及一種圖像分類方法及系統(tǒng)。
背景技術(shù)
圖像分類即是,根據(jù)各自在圖像信息中所反映的不同特征,把不同類別的目標(biāo)區(qū)分開(kāi)來(lái)的圖像處理方法。它利用計(jì)算機(jī)對(duì)圖像進(jìn)行定量分析,把圖像或圖像中的每個(gè)像元或區(qū)域劃歸為若干個(gè)類別中的某一種,以代替人的視覺(jué)判讀。
在最近的十年中,圖像分類是計(jì)算機(jī)視覺(jué)領(lǐng)域的一個(gè)研究熱點(diǎn)。BOW(字典袋)技術(shù)已被證明是最有效的圖像分類的方法之一。
然而,在BOW方法中,空間的上下文信息,如字共生和成對(duì)的信息被忽略,產(chǎn)生的視覺(jué)單詞仍然不夠說(shuō)明問(wèn)題,限制了圖像的整體分類性能。此外,基于局部特征是相互獨(dú)立的假設(shè),如樸素貝葉斯,并不是總能成立。
發(fā)明內(nèi)容
有鑒于此,有必要提供一種圖像分類方法及系統(tǒng)。
本發(fā)明提供一種圖像分類方法,該方法包括如下步驟:a.對(duì)要分類的圖像進(jìn)行多尺度分割;b.對(duì)多尺度分割后的圖像進(jìn)行顯著圖提取;c.對(duì)顯著圖提取后的圖像進(jìn)行直方圖挖掘;d.對(duì)直方圖挖掘后的圖像進(jìn)行歸一化;e.采用支持向量機(jī)對(duì)上述歸一化的圖像進(jìn)行分類。
其中,所述的多尺度分割包括將所述圖像劃分成多塊,修改所述劃分后圖像的結(jié)構(gòu)信息表示。
所述的步驟b采用基于圖形的視覺(jué)顯著性的自下而上的顯著性模型提取圖像的顯著圖。
所述的步驟c中直方圖挖掘基于:R(m)=d(m)×v(m),其中,d(m)(0≤d(m≤)和1)v(m)分別是差異性分?jǐn)?shù)和代表性分?jǐn)?shù)。
所述步驟d中的歸一化包括:平方根歸一化、L1歸一化、類內(nèi)和類間l1歸一化、l2歸一化、類內(nèi)和類間l2歸一化。
本發(fā)明還提供一種圖像分類系統(tǒng),包括相互電性連接的分割模塊、提取模塊、挖掘模塊、歸一化模塊及分類模塊。其中,所述分割模塊用于對(duì)要分類的圖像進(jìn)行多尺度分割;所述提取模塊用于對(duì)多尺度分割后的圖像進(jìn)行顯著圖提取;所述挖掘模塊用于對(duì)顯著圖提取后的圖像進(jìn)行直方圖挖掘;所述歸一化模塊用于對(duì)直方圖挖掘后的圖像進(jìn)行歸一化;所述分類模塊用于采用支持向量機(jī)對(duì)上述歸一化的圖像進(jìn)行分類。
其中,所述的多尺度分割包括將所述圖像劃分成多塊,修改所述劃分后圖像的結(jié)構(gòu)信息表示。
所述的提取模塊采用基于圖形的視覺(jué)顯著性的自下而上的顯著性模型提取圖像的顯著圖。
所述的直方圖挖掘基于:R(m)=d(m)×v(m),其中,d(m)(0≤d(m)≤1)和v(m)分別是差異性分?jǐn)?shù)和代表性分?jǐn)?shù)。
所述的歸一化包括:平方根歸一化、L1歸一化、類內(nèi)和類間l1歸一化、l2歸一化、類內(nèi)和類間l2歸一化。
本發(fā)明圖像分類方法及系統(tǒng),利用顯著區(qū)域定位、直方圖挖掘、圖像評(píng)分、差異性學(xué)習(xí)等進(jìn)行圖像分類。主要貢獻(xiàn)如下:首先,結(jié)合直方圖挖掘的多尺度空間進(jìn)行金字塔的圖像表示,基于邊緣的密集描述符提高分類性能和減少計(jì)算時(shí)間;其次,顯著圖提取構(gòu)建BoP模型,增加區(qū)分判斷能力;第三,從視覺(jué)顯著性獲得的圖像得分被集成到SVM分類器的分離超平面,所述圖像得分被視為潛在的信息,以提高區(qū)分能力;最后,提出了考慮類間和類內(nèi)變化,也考慮直方圖的統(tǒng)計(jì)信息的直方圖歸一化方法。
附圖說(shuō)明
圖1為本發(fā)明圖像分類方法的流程圖;
圖2為本發(fā)明較佳實(shí)施例圖像多尺度分割示意圖;
圖3為本發(fā)明較佳實(shí)施例圖像、顯著圖、顯著圖的灰度形式示意圖;
圖4為本發(fā)明較佳實(shí)施例事件數(shù)據(jù)集的直方圖PDF示意圖;
圖5為本發(fā)明較佳實(shí)施例足球數(shù)據(jù)集的直方圖PDF示意圖;
圖6為本發(fā)明圖像分類系統(tǒng)的硬件架構(gòu)圖。
具體實(shí)施方式
下面結(jié)合附圖及具體實(shí)施例對(duì)本發(fā)明作進(jìn)一步詳細(xì)的說(shuō)明。
參閱圖1所示,是本發(fā)明圖像分類方法較佳實(shí)施例的作業(yè)流程圖。
步驟S401,對(duì)要分類的圖像進(jìn)行多尺度分割。具體而言,將每個(gè)所述圖像劃分成多塊,修改所述劃分后圖像的結(jié)構(gòu)信息表示。圖2示出了多尺度分割后的圖像空間金字塔。圖2中1×1(原始圖像)、2×2、4×4的區(qū)域(總共21個(gè)區(qū)域)均由SPM技術(shù)生成。本實(shí)施例中,所述圖像的縱橫比保持SPM的多尺度技術(shù)。從多尺度分割和密集采樣中得到特征矢量,一般是高維數(shù),通過(guò)主成分分析(PCA)和線性判別分析(LDA)進(jìn)行降維運(yùn)算,從而產(chǎn)生良好的結(jié)果,且不顯著損失。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于深圳大學(xué),未經(jīng)深圳大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410177159.0/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書(shū)寫(xiě)字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫(huà)組成的,而且每個(gè)筆畫(huà)表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 一種數(shù)據(jù)庫(kù)讀寫(xiě)分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





