[發明專利]圖像分類模型的訓練方法及分類方法有效
| 申請號: | 202010013254.2 | 申請日: | 2020-01-07 |
| 公開(公告)號: | CN111242199B | 公開(公告)日: | 2023-07-14 |
| 發明(設計)人: | 夏素縵;程誠;汪浩源;王旭光 | 申請(專利權)人: | 中國科學院蘇州納米技術與納米仿生研究所 |
| 主分類號: | G06V10/764 | 分類號: | G06V10/764 |
| 代理公司: | 深圳市銘粵知識產權代理有限公司 44304 | 代理人: | 孫偉峰 |
| 地址: | 215123 江蘇省*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 圖像 分類 模型 訓練 方法 | ||
1.一種圖像分類模型的訓練方法,其特征在于,所述圖像分類模型包括特征提取網絡和全連接層,所述訓練方法包括:
特征提取網絡獲取訓練樣本集的樣本特征向量,其中所述訓練樣本集包括多個不同類樣本;
全連接層根據樣本特征向量的特征維度N和訓練樣本集的類別數目C生成與每一類樣本一一對應的類別向量;
獲取同類樣本的樣本特征向量和類別向量之間的第一歐式距離,并獲取不同類樣本的類別向量之間的第二歐式距離;
根據第一歐式距離和第二歐式距離計算樣本損失,并根據樣本損失更新圖像分類模型的參數:
根據損失函數公式計算樣本損失,其中所述損失函數的公式為:
其中,Loss表示樣本損失,B為一次運算輸入的樣本數目,C為訓練樣本集的類別數目,xi表示第i個樣本的樣本特征向量,yi表示第i個樣本的標簽,W表示N×C維度的全連接層參數矩陣,Wi表示W的第i個列向量即類別向量,N表示特征維度,λ表示可調參數,為第一歐式距離,為第二歐式距離。
2.根據權利要求1所述的圖像分類模型的訓練方法,其特征在于,全連接層根據樣本特征向量的特征維度N和訓練樣本集的類別數目C生成與每一類樣本一一對應的類別向量的具體方法包括:
根據樣本特征向量的特征維度N和訓練樣本集的類別數目C構建參數矩陣,其中參數矩陣的大小為N*C;
對參數矩陣進行初始化處理,其中初始化處理后的參數矩陣的每一列向量為不同類樣本對應的類別向量。
3.根據權利要求1所述的圖像分類模型的訓練方法,其特征在于,根據樣本損失更新圖像分類模型的參數的具體方法包括:
根據樣本損失計算樣本特征向量和類別向量的梯度;
根據梯度更新所述特征提取網絡的參數和所述全連接層的參數矩陣。
4.一種圖像分類模型的訓練裝置,其特征在于,所述訓練裝置包括:
特征提取模塊,被配置為利用特征提取網絡獲取訓練樣本集的樣本特征向量,其中所述訓練樣本集包括多個不同類樣本;
類別特征生成模塊,被配置為全連接層根據樣本特征向量的特征維度N和訓練樣本集的類別數目C生成與每一類樣本一一對應的類別向量;
距離計算模塊,被配置為獲取同類樣本的樣本特征向量和類別向量之間的第一歐式距離,并獲取不同類樣本的類別向量之間的第二歐式距離;
更新模塊,被配置為根據第一歐式距離和第二歐式距離計算樣本損失,并根據樣本損失更新圖像分類模型的參數,所述更新模塊包括:
損失函數計算子模塊,被配置為根據損失函數公式計算樣本損失,其中所述損失函數的公式為:
其中,Loss表示樣本損失,B為一次運算輸入的樣本數目,C為訓練樣本集的類別數目,xi表示第i個樣本的樣本特征向量,yi表示第i個樣本的標簽,W表示N×C維度的全連接層參數矩陣,Wi表示W的第i個列向量即類別向量,N表示特征維度,λ表示可調參數,為第一歐式距離,為第二歐式距離。
5.根據權利要求4所述的圖像分類模型的訓練裝置,其特征在于,所述類別特征生成模塊包括:
矩陣構建模塊,被配置為根據樣本特征向量的特征維度N和訓練樣本集的類別數目C構建參數矩陣,其中參數矩陣的大小為N*C;
初始化模塊,被配置為對參數矩陣進行初始化處理,其中初始化處理后的參數矩陣的每一列向量為不同類樣本對應的類別向量。
6.根據權利要求4所述的圖像分類模型的訓練裝置,其特征在于,所述更新模塊還包括:
參數更新子模塊,被配置為根據樣本損失計算樣本特征向量和類別向量的梯度,并根據梯度更新所述特征提取網絡的參數和所述全連接層的參數矩陣。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院蘇州納米技術與納米仿生研究所,未經中國科學院蘇州納米技術與納米仿生研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010013254.2/1.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





