[發明專利]圖像分類模型的訓練方法及分類方法有效
| 申請號: | 202010013254.2 | 申請日: | 2020-01-07 |
| 公開(公告)號: | CN111242199B | 公開(公告)日: | 2023-07-14 |
| 發明(設計)人: | 夏素縵;程誠;汪浩源;王旭光 | 申請(專利權)人: | 中國科學院蘇州納米技術與納米仿生研究所 |
| 主分類號: | G06V10/764 | 分類號: | G06V10/764 |
| 代理公司: | 深圳市銘粵知識產權代理有限公司 44304 | 代理人: | 孫偉峰 |
| 地址: | 215123 江蘇省*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 圖像 分類 模型 訓練 方法 | ||
本發明公開了圖像分類模型的訓練方法及分類方法。該訓練方法包括:特征提取網絡獲取訓練樣本集的樣本特征向量,訓練樣本集包括多個不同類樣本;全連接層根據樣本特征向量的特征維度N和訓練樣本集的類別數目C生成與每一類樣本一一對應的類別向量;獲取同類樣本的樣本特征向量和類別向量之間的第一歐式距離,并獲取不同類樣本的類別向量之間的第二歐式距離;根據第一歐式距離和第二歐式距離計算樣本損失,并根據樣本損失更新圖像分類模型的參數。本申請的訓練方法可使得同類樣本之間更加靠近,不同類樣本之間更加遠離,同時本申請在訓練過程每個類別所需求的數據量少,每個類別的區分度更高,從而提高了模型的識別準確率。
技術領域
本發明屬于計算機視覺和圖像處理技術領域,具體地講,涉及一種圖像分類模型的訓練方法以及分類方法和訓練裝置、計算機可讀存儲介質、計算機設備。
背景技術
隨著大數據時代的來臨,圖像識別技術的應用場景也越來越廣泛,而損失函數softmax?loss也因為其易于優化、收斂快等特征廣泛應用于圖像識別的學習網絡中。現有的softmax?loss所用的全連接層通常是計算樣本與全連接層各個類別向量之間的距離,包括計算余弦距離和計算歐式距離。此時深度學習網絡的訓練目標就是讓樣本圖像的特征與全連接層標簽方向的類別向量距離盡量近,而與全連接層其他方向的類別向量距離盡量遠。在訓練數據足夠的情況下,這種全連接層計算方式與softmax?loss結合可以訓練出精度足夠高的圖像識別模型。
現有技術最大的缺點是對數據的需求極大,在某個圖像的數據較少時無法得出該圖像有效的信息。例如,某一類的圖像數量特別多,那么訓練完成的模型對該類圖像的識別率較準確,另外一類的圖像數量特別少,那么訓練完成的模型對該類圖像的識別率較低。實際情況中,數據不均衡是客觀存在的,因此對于本領域技術人員來說,如何利用不均衡的數據訓練得到對各個類別圖像的識別率都較高的模型是急需解決的技術問題。
發明內容
(一)本發明所要解決的技術問題
本發明解決的技術問題是:如何提高圖像分類模型的識別準確率。
(二)本發明所采用的技術方案
一種圖像分類模型的訓練方法,所述圖像分類模型包括特征提取網絡和全連接層,所述訓練方法包括:
特征提取網絡獲取訓練樣本集的樣本特征向量,其中所述訓練樣本集包括多個不同類樣本;
全連接層根據樣本特征向量的特征維度N和訓練樣本集的類別數目C生成與每一類樣本一一對應的類別向量;
獲取同類樣本的樣本特征向量和類別向量之間的第一歐式距離,并獲取不同類樣本的類別向量之間的第二歐式距離;
根據第一歐式距離和第二歐式距離計算樣本損失,并根據樣本損失更新圖像分類模型的參數。
優選地,全連接層根據樣本特征向量的特征維度N和訓練樣本集的類別數目C生成與每一類樣本一一對應的類別向量的具體方法包括:
根據樣本特征向量的特征維度N和訓練樣本集的類別數目C構建參數矩陣,其中參數矩陣的大小為N*C;
對參數矩陣進行初始化處理,其中初始化處理后的參數矩陣的每一列向量為不同類樣本對應的類別向量。
優選地,根據第一歐式距離和第二歐式距離計算樣本損失的具體方法為:
根據損失函數公式計算樣本損失,其中所述損失函數的公式為:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院蘇州納米技術與納米仿生研究所,未經中國科學院蘇州納米技術與納米仿生研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010013254.2/2.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





