[發明專利]多類別圖像的分類方法、裝置、終端設備和存儲介質在審
| 申請號: | 202011553020.3 | 申請日: | 2020-12-24 |
| 公開(公告)號: | CN112651438A | 公開(公告)日: | 2021-04-13 |
| 發明(設計)人: | 張力文;金子杰;林聰;佟樂;肖貴寶;潘浩;王剛 | 申請(專利權)人: | 世紀龍信息網絡有限責任公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/04;G06N3/08;G06F16/55 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 王寶筠 |
| 地址: | 510000 廣東省廣州市天河*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 類別 圖像 分類 方法 裝置 終端設備 存儲 介質 | ||
1.一種多類別圖像的分類方法,其特征在于,所述方法包括:
獲取待分類圖像;
將所述待分類圖像輸入至預先訓練的圖像分類模型,輸出所述待分類圖像的類別概率值;其中,所述圖像分類模型是采用標記有類別信息的圖像樣本對改進的卷積神經網絡進行訓練得到的,所述改進的卷積神經網絡包括Focus結構、Efficient網絡、卷積層的注意力模塊、全局池化層和全連接層;
根據所述類別概率值確定所述待分類圖像的類別。
2.根據權利要求1所述的方法,其特征在于;所述圖像分類模型的訓練方法,包括:
獲取圖像樣本,采用類別信息對所述圖像樣本進行標記,得到標記有類別信息的圖像樣本;
將所述標記有類別信息的圖像樣本輸入所述Focus結構進行降維處理;
將降維處理后的圖像樣本輸入所述Efficient網絡進行特征提取,得到初始特征圖;
將所述初始特征圖輸入所述卷積層的注意力模塊進行特征提取,得到最終特征圖;
將所述最終特征圖分別依次輸入所述全局池化層和全連接層,輸出實際分類結果;
對所述改進的卷積神經網絡的權重進行調整,直至實際分類結果與目標分類結果的偏差在容許范圍內時,訓練完成,得到所述圖像分類模型。
3.根據權利要求2所述的方法,其特征在于,所述Efficient網絡為Efficient-B0網絡,所述Efficient-B0網絡包括多個MBConv卷積模塊;在將降維處理后的圖像樣本輸入所述Efficient網絡進行特征提取,得到初始特征圖的步驟中,包括:
采用多個所述MBConv卷積模塊對所述降維處理后的圖像樣本進行特征提取,得到所述初始特征圖;其中,在采用所述MBConv卷積模塊進行特征提取時采用Swish激活函數和Dropconnect方法。
4.根據權利要求2所述的方法,其特征在于,所述卷積層的注意力模塊包括通道注意力模塊和空間注意力模塊;在將所述初始特征圖輸入所述卷積層的注意力模塊進行特征提取,得到最終特征圖的步驟中,包括:
將所述初始特征圖依次輸入所述通道注意力模塊和空間注意力模塊進行通道加權和空間像素點加權,得到所述最終特征圖。
5.根據權利要求1-4任一項所述的方法,其特征在于,在將所述最終特征圖分別依次輸入所述全局池化層和全連接層,輸出實際分類結果的步驟中,包括:
采用sigmoid或concurrent-softmax計算損失函數。
6.根據權利要求5所述的方法,其特征在于,將所述標記有類別信息的圖像樣本輸入所述Focus結構進行降維處理的步驟之前,還包括:
選擇一種或多種增強處理方法對所述標記有類別信息的圖像樣本進行增強處理;其中,所述增強處理方法包括對所述標記有類別信息的圖像樣本增加噪聲處理、模糊化處理、色彩顏色空間轉化處理、翻轉處理、旋轉處理、Mosaic數據增強處理。
7.根據權利要求6所述所述的方法,其特征在于,所述Mosaic數據增強處理的步驟中,包括:
從所述標記有類別信息的圖像樣本中隨機選擇出若干張圖片;
從選擇出的每一張圖片中隨機選出坐標點,作為目標區域的分割點;
將每一張圖片隨機放置于所述目標區域并進行填充,得到合并圖片;
將每一張圖片的標簽信息作為所述合并圖片的標簽信息。
8.一種多類別圖像的分類裝置,其特征在于,所述裝置包括:
待分類圖像獲取模塊,用于獲取待分類圖像;
類別概率值輸出模塊,用于將所述待分類圖像輸入至預先訓練的圖像分類模型,輸出所述待分類圖像的類別概率值;其中,所述圖像分類模型是采用標記有類別信息的圖像樣本對改進的卷積神經網絡進行訓練得到的,所述改進的卷積神經網絡包括Focus結構、Efficient網絡、卷積層的注意力模塊、全局池化層和全連接層;
類別確定模塊,用于根據所述類別概率值確定所述待分類圖像的類別。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于世紀龍信息網絡有限責任公司,未經世紀龍信息網絡有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011553020.3/1.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





