[發明專利]分類模型訓練方法及裝置有效
| 申請號: | 201910129385.4 | 申請日: | 2019-02-21 |
| 公開(公告)號: | CN109886335B | 公開(公告)日: | 2021-11-26 |
| 發明(設計)人: | 王辰龍 | 申請(專利權)人: | 廈門美圖之家科技有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 北京超凡志成知識產權代理事務所(普通合伙) 11371 | 代理人: | 郭俊霞 |
| 地址: | 361000 福建省廈門市*** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 分類 模型 訓練 方法 裝置 | ||
本申請公開了一種分類模型訓練方法及裝置,通過單獨計算每個標簽的二值交叉熵,提高所獲得的標簽的精度。詳細地,首先通過獲取多個第一訓練樣本,其中,每個第一訓練樣本包括第一訓練圖像以及與該第一訓練圖像對應的第一預設數量個標簽,所述第一預設數量個標簽包括與圖像內容對應的上位分類以及下位分類分別對應的標簽;然后,根據多個所述第一訓練樣本進行機器學習訓練,獲得初始分類模型;在獲得初始分類模型后,分別獲取初始分類模型中每個標簽的二值交叉熵作為該標簽的子誤差值;最后,根據每個標簽的子誤差值獲得初始分類模型的總誤差值,進而根據所述總誤差值調整所述初始分類模型,獲得目標分類模型。
技術領域
本申請涉及圖像處理技術領域,具體而言,涉及一種分類模型訓練方法及裝置。
背景技術
現有技術中,在圖像分類時,有兩大類常見的分類方法,其中一種分類方法就是單標簽分類方法,在這種方法中,每張圖像只擊打一個標簽,也就是說,每張圖像只分為一個類別,因此,這種分類方法并不能完整地表達圖像的語義;另一種分類方法是多標簽分類,這種方法中,同一圖像可以對應擊打多個標簽,也就是說,每張圖像可以劃分為多個類別。在現有的多標簽分類算法中,如果同一圖像對應的多個標簽中存在一個標簽所對應的含義是另一個或多個標簽所對應含義的上位分類,即這些標簽之間存在依賴關系。現有的多標簽分類算法中,若識別到的圖像分類具有存在依賴關系的多個標簽,只有輸出其中一個標簽作為該圖像的分類標簽。因此,現有多標簽分類方法存在輸出的標簽精度低的問題。
發明內容
為了克服現有技術中的上述不足,本申請的目的在于提供一種分類模型訓練方法,所述方法包括:
獲取多個第一訓練樣本,其中,每個第一訓練樣本包括第一訓練圖像以及與該第一訓練圖像對應的第一預設數量個標簽,所述第一預設數量個標簽包括與圖像內容對應的上位分類以及下位分類分別對應的標簽;
根據多個所述第一訓練樣本進行機器學習訓練,獲得初始分類模型;
分別獲取初始分類模型中每個標簽的二值交叉熵作為對應的子誤差值;
根據所述每個標簽的子誤差值計算獲得所述初始分類模型的總誤差值;
根據所述總誤差值調整所述初始分類模型,獲得目標分類模型。
可選地,所述根據所述總誤差值調整所述初始分類模型,獲得目標分類模型的步驟包括:
檢測所述總誤差值是否大于預設值;
若所述總誤差值大于預設值,則調整所述初始分類模型的參數,直至所述總誤差值小于所述預設值;
若所述總誤差值小于所述預設值,則將調整參數后的初始分類模型作為目標分類模型。
可選地,所述獲取多個第一訓練樣本的步驟前,所述方法還包括:
獲取多個初始樣本,每個所述初始樣本包括初始圖像以及與該初始圖像對應的第一預設數量個標簽,所述第一預設數量個標簽包括與圖像內容對應的上位分類的標簽以及下位分類的標簽;
針對每個初始樣本,對該初始樣本中的所述初始圖像進行變換,獲得多個所述第一訓練樣本。
可選地,所述變換包括隨機裁剪、隨機翻轉、隨機顏色調整或隨機亮度調整中的至少一種。
可選地,所述根據多個所述第一訓練樣本進行機器學習訓練,獲得初始分類模型的步驟包括:
將所述多個第一訓練樣本輸入已訓練的預分類模型,對該預分類模型進行再次訓練;
對所述預分類模型進行調整,獲得所述初始分類模型。
可選地,所述預分類模型包括卷積層、池化層和全連接層,所述對所述預分類模型進行調整,獲得所述初始分類模型的步驟包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廈門美圖之家科技有限公司,未經廈門美圖之家科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910129385.4/2.html,轉載請聲明來源鉆瓜專利網。





