[發明專利]圖像分類的方法及裝置有效
| 申請號: | 201510960328.2 | 申請日: | 2015-12-21 |
| 公開(公告)號: | CN105631466B | 公開(公告)日: | 2019-05-07 |
| 發明(設計)人: | 喬宇;郭勝;黃韡林 | 申請(專利權)人: | 中國科學院深圳先進技術研究院 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 深圳中一專利商標事務所 44237 | 代理人: | 張全文 |
| 地址: | 518000 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 圖像 分類 方法 裝置 | ||
本發明適用于計算機視覺技術領域,提供了一種圖像分類的方法及裝置。該方法包括:通過深度卷積神經網絡提取輸入圖像的中間卷積層的特征以及全連接層的特征;對提取的所述中間卷積層的特征進行預處理,并對預處理后的中間卷積層的特征進行編碼,以形成圖像表示的中層語義特征,對提取的全連接層的特征進行歸一化處理后作為圖像表示的高層語義特征;將所述圖像表示的中層語義特征和所述圖像表示的高層語義特征進行融合;基于融合后的特征進行圖像分類。通過本發明,可有效提高圖像內容識別的準確率,進而提高圖像分類的準確率。
技術領域
本發明屬于計算機視覺技術領域,尤其涉及圖像分類的方法及裝置。
背景技術
圖像分類技術是指通過計算機算法判斷圖像內容如物體、場景等所屬的類別。而圖像分類技術中圖像的特征表示將直接影響最終的判斷結果。隨著深度學習的發展,使用大量數據訓練的卷積神經網絡模型成為主要的圖像分類技術,該技術利用卷積神經網絡中的全連接層作為圖像的特征表示,然后利用SoftMax等分類器進行分類,在實際應用中取得了較好的效果。
然而,全連接層的圖像特征表示的是圖像的高層語義特征,主要描述圖像的整體布局。但在許多圖像中,例如:臥室和客廳,整體布局相同,但是客廳一般只放沙發,臥室只放床。而這些物體上的差異信息高層語義特征往往無法表述,影響了圖像分類的準確率。
發明內容
鑒于此,本發明實施例提供一種圖像分類的方法及裝置,以提高圖像分類的準確率。
第一方面,本發明實施例提供了一種圖像分類的方法,所述方法包括:
通過卷積神經網絡提取輸入圖像的中間卷積層的特征以及全連接層的特征;
對提取的所述中間卷積層的特征進行預處理,并對預處理后的中間卷積層的特征進行編碼,以形成圖像表示的中層語義特征,對提取后的全連接層的特征進行歸一化處理后作為圖像表示的高層語義特征;
將所述圖像表示的中層語義特征和所述圖像表示的高層語義特征進行融合;
基于融合后的特征進行圖像分類。
第二方面,一種圖像分類的裝置,所述裝置包括:
特征提取單元,用于通過卷積神經網絡提取輸入圖像的中間卷積層的特征以及全連接層的特征;
處理單元,用于對提取的所述中間卷積層的特征進行預處理,并對預處理后的中間卷積層的特征進行編碼,以形成圖像表示的中層語義特征,對提取后的全連接層的特征進行歸一化處理后作為圖像表示的高層語義特征;
融合單元,用于將所述圖像表示的中層語義特征和所述圖像表示的高層語義特征進行融合;
分類單元,用于基于融合后的特征進行圖像分類。
本發明實施例與現有技術相比存在的有益效果是:本發明實施例通過卷積神經網絡提取輸入圖像的中間卷積層的特征,對提取的所述中間卷積層的特征進行預處理后編碼成圖像表示的中層語義特征,并將所述圖像表示的中層語義特征和圖像表示的高層語義特征進行融合,通過融合后的混合特征來表示圖像信息,由于融合后的混合特征不僅能夠體現圖像的高層全局語義特征而且也能很好的體現圖像的細節和局部信息,因此效果相比單一的全連接層特征有明顯提高,可有效提高圖像內容識別的準確率,進而提高圖像分類的準確率,具有較強的易用性和實用性。
附圖說明
為了更清楚地說明本發明實施例中的技術方案,下面將對實施例或現有技術描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發明的一些實施例,對于本領域普通技術人員來講,在不付出創造性勞動性的前提下,還可以根據這些附圖獲得其他的附圖。
圖1是本發明實施例提供的圖像分類的方法的實現流程示意圖;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院深圳先進技術研究院,未經中國科學院深圳先進技術研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510960328.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:兩層粘接碳石墨結構電刷
- 下一篇:帶導線一次模壓成型三層材質結構電刷
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





