[發明專利]一種基于圖像顯著區域的圖像分類方法和系統在審
| 申請號: | 201710167640.5 | 申請日: | 2017-03-20 |
| 公開(公告)號: | CN107016409A | 公開(公告)日: | 2017-08-04 |
| 發明(設計)人: | 程起敏;涂叢歡;張倩;涂明明;邵康 | 申請(專利權)人: | 華中科技大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06K9/46;G06T7/136 |
| 代理公司: | 華中科技大學專利中心42201 | 代理人: | 李智,曹葆青 |
| 地址: | 430074 湖北*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 圖像 顯著 區域 分類 方法 系統 | ||
技術領域
本發明屬于圖像內容分類及檢索領域,更具體地,涉及一種基于圖像顯著區域的圖像分類方法和系統。
背景技術
隨著計算機與數字信息技術的不斷發展,每天都有大量的數字圖像通過各種渠道出現在人們的生活中。圖像是對客觀事物的一種相似性或者生動性的描述,是人類社會活動中最常用的信息載體,它作為人們最主要的信息來源,正在以各種各樣的方式滲透到人們的工作、學習和生活中。在圖像分類和檢索等圖像處理和分析的過程中,傳統的方法大都會對圖像的全圖信息進行描述和分析,然而對圖像的全圖描述有時會包含干擾信息,比如針對包含顯著區域的圖像而言,圖像的顯著區域信息可以體現圖像類別,而對背景信息的考慮會對圖像分類和檢索性能造成影響。
對于包含顯著區域的圖像而言,要想獲取圖像顯著區域信息,往往需要定位或者分割提取出圖像顯著區域,目前提出的分割提取圖像顯著區域的方法可以分為兩類:基于人工標注的交互式分割提取和基于圖像顯著性檢測的自動分割提取。由于互聯網圖像數據量非常龐大,交互式分割方法耗時費力;而基于圖像顯著度的自動分割應用于背景較復雜的圖像時,存在區域邊界處劃分準確率低或者誤將目標區域劃分成背景的局限。
圖像分類是對互聯網上龐大的圖像資源進行組織、管理和檢索的關鍵技術。目前圖像分類大多基于全圖實現,當圖像語義類別相同但背景不同時,底層視覺特征一般不相似,針對這種圖像訓練圖像分類器,分類性能會受背景信息的影響,從而使得圖像分類準確率降低。而在不同拍攝條件下獲取的圖像,例如智能手機和平板電腦的圖像,會出現底層視覺特征十分相似但語義類別明顯不同的情況,僅僅基于底層視覺特征很難實現有效分類。因此針對包含顯著區域的圖像而言,圖像類別往往由圖像顯著區域信息表現,基于原圖進行圖像類別判斷會出現信息干擾,影響分類準確度。
發明內容
本發明針對上述現有技術的不足,提出一種基于圖像顯著區域的圖像分類方法和系統,本發明的目的在于保證分割結果的前提下,減少人工交互的工作量,提高了圖像分類的準確率。
為實現上述目的,按照本發明的一個方面,提供了一種基于圖像顯著區域的圖像分類方法,包括離線訓練和在線測試部分:
離線訓練部分包括以下步驟:
S1:對圖像進行N次超像素分割得到圖像N層尺度下的分割塊,計算圖像的N層尺度下分割塊的特征對比度得到N個顯著圖,融合N個顯著圖得到目標顯著圖;
S2:對目標顯著圖進行閾值分割得到二值圖像,然后對該二值圖像分別作形態學處理得到圖像標記,然后基于圖像標記利用分割算法對目標顯著圖進行自動分割提取得到顯著區域;
S3:將顯著區域作為訓練樣本輸入到卷積神經網絡中訓練,得到基于圖像顯著區域的圖像分類器;
在線測試部分包括以下步驟:
S4:測試圖像按照步驟S1和S2的方式完成測試圖像的顯著區域自動分割提取,然后將測試圖像的顯著區域圖像輸入到離線訓練好的圖像分類器,圖像分類器輸出圖像分類結果。
進一步的,S1中的特征對比度為色彩對比度、空間對比度和紋理對比度中的一種或幾種。
更進一步的,S1中的特征對比度為色彩對比度和空間對比度。
進一步的,S2中閾值設定為W和H為目標顯著圖S的長和寬,(x,y)為目標顯著圖內像素點的坐標。
進一步的,S2中分割算法為GrowCut算法、GraphCut算法和GrabCut算法中的任意一種。
更進一步的,S2中分割算法為GrowCut算法。
進一步的,S3中卷積神經網絡為AlexNet網絡、LeNet網絡、GoogLeNet網絡、VGG網絡和ResNet網絡中的任意一種。
更進一步的,S3中卷積神經網絡為AlexNet網絡。
進一步的,S3中AlexNet網絡通過來少量的權重衰減減小訓練誤差,其中權重更新規則為:
其中i是迭代次數,v是動力變量,ε是學習率,是對ωi求值的倒數在第i批樣本Di上的平均值,ωi表示第i次迭代后的權重,ωi+1表示第i+1次迭代后的權重,vi表示第i次迭代后的動力變量,vi+1表示第i+1次迭代后的動力變量。
按照本發明的另一個方面,提供了一種基于圖像顯著區域的圖像分類系統,包括離線訓練模塊和在線測試模塊:
所述離線訓練模塊包括以下子模塊:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華中科技大學,未經華中科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710167640.5/2.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





