[發明專利]基于卷積神經網絡和連通圖的圖片歸類方法及相關設備有效
| 申請號: | 202010426648.0 | 申請日: | 2020-05-19 |
| 公開(公告)號: | CN111597373B | 公開(公告)日: | 2023-06-20 |
| 發明(設計)人: | 鄧柯;王海灃 | 申請(專利權)人: | 清華大學 |
| 主分類號: | G06V10/764 | 分類號: | G06V10/764;G06V10/82;G06V10/74;G06N3/0464;G06N3/096 |
| 代理公司: | 深圳市鼎言知識產權代理有限公司 44311 | 代理人: | 曾昭毅;陳實順 |
| 地址: | 100084 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 卷積 神經網絡 連通 圖片 歸類 方法 相關 設備 | ||
本發明提供一種基于卷積神經網絡和連通圖的圖片歸類方法及相關設備。所述圖片歸類方法包括:獲取多個待歸類圖片;將所述多個待歸類圖片進行預處理;將每個預處理后的待歸類圖片輸入卷積神經網絡進行特征提取,得到每個待歸類圖片的特征向量;計算每兩個待歸類圖片的特征向量之間的距離;根據每兩個待歸類圖片的特征向量之間的距離構建至少一個連通圖;對每個連通圖進行減邊處理;根據所有減邊處理后的連通圖,輸出所述多個待歸類圖片的歸類結果。本發明可以實現快速、準確的相似圖片歸類。
技術領域
本發明涉及圖像處理技術領域,具體涉及一種基于卷積神經網絡和連通圖的圖片歸類方法及相關設備。
背景技術
隨著圖像處理技術的發展,相似圖片歸類的需求日益劇增。相似圖片歸類就是將大量圖片進行分組,每組為相似圖片。相似圖片的來源有很多,以拍照為例,對于同一個實物,拍攝角度的不同,拍攝時光照的不同,照相機距離物體的遠近都會形成相似圖片。報紙廣告、公章、商標的去重問題中也會包含大量相似圖片。相似圖片歸類主要有如下兩個特征。第一,待處理圖片量很大,人工處理非常困難。第二,同屬一類的圖片整體上具有較強的相似性,但在大小尺寸、明暗對比、擺放角度、拍攝形變、背景噪聲等細節上有諸多不同。現有的相似圖片歸類方法正確率不高,容易出現錯分的情況。
發明內容
鑒于以上內容,有必要提出一種基于卷積神經網絡和連通圖的圖片歸類方法及相關設備,其可以實現快速、準確的相似圖片歸類。
本申請的第一方面提供一種基于卷積神經網絡和連通圖的圖片歸類方法,所述方法包括:
獲取多個待歸類圖片;
將所述多個待歸類圖片進行預處理;
將每個預處理后的待歸類圖片輸入卷積神經網絡進行特征提取,得到每個待歸類圖片的特征向量;
計算每兩個待歸類圖片的特征向量之間的距離;
根據每兩個待歸類圖片的特征向量之間的距離構建至少一個連通圖,所述至少一個連通圖的每個頂點對應一個待歸類圖片,若兩個待歸類圖片的特征向量之間的距離小于或等于預設閾值,則所述兩個待歸類圖片對應的頂點用邊相連;
對每個連通圖進行減邊處理,對于該連通圖中的每條邊,判斷該條邊的兩個頂點所連接的頂點數是否小于該連通圖的總頂點數,若該條邊的兩個頂點所連接的頂點數小于該連通圖的總頂點數,則刪除該條邊;
根據所有減邊處理后的連通圖,輸出所述多個待歸類圖片的歸類結果。
另一種可能的實現方式中,所述將所述多個待歸類圖片進行預處理包括:
將所述多個待歸類圖片轉換為預設圖片格式;和/或
將所述多個待歸類圖片轉換為預設尺寸;和/或
將所述多個待歸類圖片轉換為預設顏色。
另一種可能的實現方式中,所述卷積神經網絡包括AlexNet網絡、VGGNet網絡、GoogleNet網絡、ResNet網絡。
另一種可能的實現方式中,所述將每個預處理后的待歸類圖片輸入卷積神經網絡進行特征提取之前,所述方法還包括:
使用公共圖片庫對所述卷積神經網絡進行預訓練;
使用已標注相似圖片類別的圖片對預訓練后的卷積神經網絡進行相似圖片歸類任務微調。
另一種可能的實現方式中,所述對每個連通圖進行減邊處理之后,所述方法還包括:
對每個減邊處理后的連通圖進行增邊處理,若兩個頂點在一個連通圖中但是沒有相連的邊,則在所述兩個頂點之間增加一條邊。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于清華大學,未經清華大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010426648.0/2.html,轉載請聲明來源鉆瓜專利網。





