[發(fā)明專利]圖像分類任務的模型訓練方法有效
| 申請?zhí)枺?/td> | 202011278251.8 | 申請日: | 2020-11-16 |
| 公開(公告)號: | CN112488160B | 公開(公告)日: | 2023-02-07 |
| 發(fā)明(設計)人: | 張奎;陳清梁;王超 | 申請(專利權)人: | 浙江新再靈科技股份有限公司 |
| 主分類號: | G06V10/764 | 分類號: | G06V10/764;G06V10/774;G06V10/82;G06N3/04 |
| 代理公司: | 北京謹誠君睿知識產(chǎn)權代理事務所(特殊普通合伙) 11538 | 代理人: | 延慧;武麗榮 |
| 地址: | 310052 浙江省杭*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 圖像 分類 任務 模型 訓練 方法 | ||
本發(fā)明涉及一種圖像分類任務的模型訓練方法,包括:a、利用數(shù)據(jù)集中的一部分樣本訓練小樣本模型,利用之對數(shù)據(jù)集中的另一部分樣本進行預標注;b、對數(shù)據(jù)集進行訓練集和測試集劃分;c、利用訓練集訓練分類模型,并利用分類模型對測試集中的樣本分類;d、對分類結(jié)果與預標注的標簽不一致的樣本進行再標注;e、將訓練集和測試集互換,重復一次步驟(c)和(d);f、重復步驟(b)至(e)至達到收斂條件,將數(shù)據(jù)集劃分為訓練集、驗證集和測試集,完成最終訓練。本發(fā)明僅需要預標注少量的樣本,通過多次迭代的模型訓練、錯誤數(shù)據(jù)重標注的方式來完成數(shù)據(jù)集標注和模型訓練,具有標注成本低、數(shù)據(jù)利用率高和模型準確率高的優(yōu)點。
技術領域
本發(fā)明涉及一種圖像分類任務的模型訓練方法。
背景技術
近年來,隨著深度學習技術的發(fā)展,及硬件性能的提升,越來越多的計算機視覺任務比如目標檢測、圖像分類、跟蹤、以圖搜圖等,都開始使用深度學習方案在服務器上進行計算。以圖像分類為例,往往都需要準備大量的數(shù)據(jù)集來對模型進行訓練。這無疑需要大量的人工標注成本,此外標注過程中難免會出現(xiàn)標注錯誤的情況。以車輛分類為例,假設目標類別為汽車、摩托車、電瓶車、自行車,這里除汽車外,其它三類在外觀上存在一定的相似性,很容易出現(xiàn)標注錯誤。
現(xiàn)有的技術往往只關注于系統(tǒng)的構(gòu)建,例如專利CN110580482A,構(gòu)建了一個圖像分類模型訓練、圖像分類、個性化推薦方法及裝置。側(cè)重于特征提取的改進。
與本方案相似來降低標注成本的方案采用迭代訓練,每次訓練后,剔除樣本中置信度低的圖像數(shù)據(jù),認為為這些數(shù)據(jù)集是瑕疵數(shù)據(jù)。但是,該專利的方法中,數(shù)據(jù)集需要完整的人工標注,極大地消耗人力和時間成本。另外,其標注數(shù)據(jù)在迭代訓練過程中標簽保持不變,這樣使得迭代訓練的方式對提高模型準確度的作用不大。最后,該專利對于置信度低的樣本即困難樣本直接剔除,這就使得其對樣本的利用率過低,也不利于最終的模型準確度的提高。
發(fā)明內(nèi)容
本發(fā)明的目的在于解決上述問題,提供一種圖像分類任務的模型訓練方法。
為實現(xiàn)上述目的,本發(fā)明提供一種圖像分類任務的模型訓練方法,包括以下步驟:
a、利用數(shù)據(jù)集中的一部分樣本訓練小樣本模型,利用所述小樣本模型對數(shù)據(jù)集中的另一部分樣本進行預標注;
b、對數(shù)據(jù)集進行訓練集和測試集劃分;
c、利用訓練集訓練分類模型,并利用分類模型對測試集中的樣本分類;
d、對分類結(jié)果與預標注的標簽不一致的樣本進行再標注;
e、將訓練集和測試集互換,重復一次步驟(c)和(d);
f、重復步驟(b)至(e)至達到收斂條件,將數(shù)據(jù)集劃分為訓練集、驗證集和測試集,完成分類模型的最終訓練。
根據(jù)本發(fā)明的一個方面,在所述步驟(a)中,分三次訓練三個所述小樣本模型,每個所述小樣本模型利用數(shù)據(jù)集中一部分的樣本進行標注后訓練。
根據(jù)本發(fā)明的一個方面,所述小樣本模型訓練時的初始學習率為1e-4,訓練輪數(shù)為15。
根據(jù)本發(fā)明的一個方面,在所述步驟(a)中,對于另一部分樣本分別使用三個所述小樣本模型預測得到三組分類概率值:
P1=[p11,p12,…,p1C],P2=[p21,p22,…,p2C],P3=[p31,p32,…,p3C];
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江新再靈科技股份有限公司,未經(jīng)浙江新再靈科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011278251.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種廚余垃圾處理裝置
- 下一篇:一種鋼桁梁檢查車軌道安裝的施工方法
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





