[發明專利]圖像分類方法、裝置、電子設備及存儲介質在審
| 申請號: | 202110372852.3 | 申請日: | 2021-04-07 |
| 公開(公告)號: | CN113033689A | 公開(公告)日: | 2021-06-25 |
| 發明(設計)人: | 申嘯塵;周有喜 | 申請(專利權)人: | 新疆愛華盈通信息技術有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 深圳市嘉勤知識產權代理有限公司 44651 | 代理人: | 王敏生 |
| 地址: | 830000 新疆維吾爾自治區烏魯木齊市經濟技術開*** | 國省代碼: | 新疆;65 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 圖像 分類 方法 裝置 電子設備 存儲 介質 | ||
本申請公開一種圖像分類方法、裝置、電子設備及存儲介質,方法包括:獲取圖像;將圖像輸入預先訓練的分類模型;接收分類模型對圖像的分類結果,并輸出分類結果;預先訓練分類模型的步驟包括:建立原始分類模型,并獲取樣本數據集;將樣本數據集內的樣本數據分批次輸入原始分類模型進行訓練;接收交叉熵損失函數對每批次樣本數據計算的確定標簽及否定標簽的損失值;對每批次樣本數據的確定標簽及否定標簽的損失值進行平衡,并計算平衡損失值;利用所有的平衡損失值作為總損失值對原始分類模型進行優化,直至確定標簽的損失值占比不再降低,得到分類模型;原始分類模型學習時,會向標簽為確定存在方向學習,提升對圖像進行多類別分類時的分類效果。
技術領域
本申請涉及人工智能技術領域,具體涉及一種圖像分類方法、裝置、電子設備及存儲介質。
背景技術
圖像分類是根據不同類別的目標在圖像信息中所反映的不同特征,將不同類別的目標區分開來的圖像處理方法。圖像分類方法基于神經網絡的分類模型,通常以不同計算量要求首先要選用不同的backbone(主干網絡),如resnet(殘差網絡),densenet(密集網絡),mobilenet(移動端神經網絡)等。最后建立分類數據集,選取合適的損失函數對網絡進行訓練。例如有100種不同類別的圖片,則進行100類別的分類。目前,分類模型的損失函數通常使用交叉熵損失函數。
但是交叉熵損失函數進行的是單標簽分類,在選取交叉熵損失函數進行模型訓練時,每張圖片只具有一個標簽。但若一張圖片即同時包含多種事物,如一張圖片包含狗、貓這兩種動物,在進行圖像分類時,通常會出現圖像內的多種事物中,其中一種事物的概率很高,其他種事物概率很低的情況,因此對圖片分類時,無法將可能存在的多種事物都包含在分類的類別內。
為解決上述問題,現有的方法是對一張圖片中的每一個類別都進行標簽,假設分類模型能夠進行100類圖像的分類,則需要使用100個二分類交叉熵損失函數來優化模型的輸出,對于每一類的事物,在同一張圖像中都會有一個表示存在的確定標簽或表示不存在的否定標簽,因此該一張圖像會有100個標簽,每個二分類交叉熵損失函數則分別對一個標簽計算損失值,最后相加得到總損失值,其中,確定標簽的損失值較大,否定標簽的損失值較小。在總損失值較大時,分類模型會向確定標簽的方向進行學習,從而提升分類模型的分類能力。
但是在實際中,一張圖片一般只包含幾個種類的事物,因此一張圖片的大部分標簽都為否定標簽,以一張圖片包含2個種類的事物為例,那么標簽為確定標簽的比例只占有2%,標簽為否定標簽的比例占有98%,這就導致標簽不平衡的問題,使得最后計算出的總損失值較小。
若總損失值過小,分類模型進行學習時,就不會向標簽為確定標簽的方向進行學習,從而降低了對圖像進行多個類別分類時的效果。
發明內容
基于此,為了解決或改善現有技術的問題,本申請提供一種圖像分類方法、裝置、電子設備及存儲介質,可以提高對圖像進行多個類別分類時的分類效果。
本申請第一方面提供一種圖像分類方法,包括:獲取圖像;將所述圖像輸入預先訓練的分類模型;接收所述分類模型對所述圖像的分類結果,并輸出所述分類結果;所述預先訓練分類模型的步驟包括:建立原始分類模型,并獲取樣本數據集,所述原始分類模型具有損失函數,所述樣本數據集內的樣本數據具有預設數量的類別標簽,每個所述類別標簽為對應類別的確定標簽或否定標簽;將所述樣本數據集內的樣本數據分批次輸入所述原始分類模型進行訓練;接收所述交叉熵損失函數對每批次樣本數據計算的所述確定標簽及所述否定標簽的損失值;對每批次樣本數據的確定標簽及否定標簽的損失值進行平衡,直至所有批次中,所述確定標簽及所述否定標簽的損失值占比相同,并計算每批次樣本數據的平衡損失值;利用所有的所述平衡損失值作為總損失值對所述原始分類模型進行優化,直至所述確定標簽的損失值占比不再降低,得到分類模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于新疆愛華盈通信息技術有限公司,未經新疆愛華盈通信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110372852.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種自動化炸藥裝藥滾壓工裝
- 下一篇:物聯網設備的處理方法、裝置及系統
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





