[發(fā)明專利]一種圖像分類模型的訓練方法及圖像分類方法、存儲介質(zhì)有效
| 申請?zhí)枺?/td> | 202010250560.8 | 申請日: | 2020-04-01 |
| 公開(公告)號: | CN111476285B | 公開(公告)日: | 2023-07-28 |
| 發(fā)明(設計)人: | 徐明;邵新慶;宋詠君;劉強 | 申請(專利權)人: | 深圳力維智聯(lián)技術有限公司;南京中興力維軟件有限公司 |
| 主分類號: | G06V10/774 | 分類號: | G06V10/774;G06V10/764;G06V10/82;G06N3/0464 |
| 代理公司: | 深圳鼎合誠知識產(chǎn)權代理有限公司 44281 | 代理人: | 彭家恩;彭愿潔 |
| 地址: | 518057 廣東省深圳市南*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 圖像 分類 模型 訓練 方法 存儲 介質(zhì) | ||
一種圖像分類模型的訓練方法及圖像分類方法、存儲介質(zhì),其中訓練方法包括:建立關于一分類對象的第一數(shù)據(jù)集和第二數(shù)據(jù)集,根據(jù)第一數(shù)據(jù)集對第二數(shù)據(jù)集中的第二圖像進行分類標簽的預測以得到第二圖像對應的分類標簽,根據(jù)第二圖像及其對應的分類標簽得到標注有分類標簽的第三圖像以建立第三數(shù)據(jù)集,利用第一數(shù)據(jù)集和第三數(shù)據(jù)集對預設的深度神經(jīng)網(wǎng)絡進行訓練,學習得到圖像分類模型。由于第一數(shù)據(jù)集中的各幅第一圖像標注有分類標簽,第二數(shù)據(jù)集中的各幅第二圖像沒有標注分類標簽,使得有分類標簽的圖像和無分類標簽的圖像均參與了深度神經(jīng)網(wǎng)絡的訓練過程,利于提高圖像分類模型對場景圖像的分類適應能力和分類精度。
技術領域
本發(fā)明涉及圖像處理的技術領域,具體涉及一種圖像分類模型的訓練方法及圖像分類方法、存儲介質(zhì)。
背景技術
計算機視覺是使用計算機及相關設備對生物視覺的一種模擬,它的主要任務就是通過對采集的圖片或視頻進行處理以獲得相應場景的三維信息。在計算機視覺的運用過程中,通常會進行圖像預處理和模式識別的操作,除此之外,還會涉及圖像分類、圖像識別、景物分析、形狀描述、幾何建模和圖象理解的操作。其中,圖像分類是計算機視覺的核心領域之一,可以將它看作是從給定的分類集合中為圖像分配一個標簽的任務,具體就是分析一個輸入圖像并返回一個將圖像分類的標簽,并且這個標簽是用來自預定義類別集合。
目前,隨著計算機運算能力的發(fā)展和圖像數(shù)據(jù)的爆炸式的增長,深度學習取得了巨大的成果,研究圖像分類任務往往需要大量的標注數(shù)據(jù)進行監(jiān)督學習。雖然,存在一些方法可以減少對數(shù)據(jù)的依賴,比如遷移學習、少樣本學習等,但是到目前為止,此類方法的應用性能依然還沒法與監(jiān)督學習進行相比。在實際的工程實現(xiàn)中,往往短期內(nèi)是無法收集并標注完成大量提供深度學習訓練的可用數(shù)據(jù)。這對實際的算法落地造成很多不確定的因素,如此會嚴重影響到圖像分類研究項目的進度。
此外,通過普通方式采集的數(shù)據(jù)與現(xiàn)場的數(shù)據(jù)之間會造成過度的擬合,不利于后期通過此類數(shù)據(jù)進行訓練學習。一般情況下,深度神經(jīng)網(wǎng)絡在基準數(shù)據(jù)集上表現(xiàn)很好,但在數(shù)據(jù)集之外的真實世界圖像上,效果就不那么讓人滿意了,這往往是圖像分類處理時對真實場景過于敏感而導致的結(jié)果。對于這樣的情況,即使局部存在不相同之處也會會造成很大的識別誤差,而識別誤差的產(chǎn)生會對算法的落地和推廣產(chǎn)生很嚴重的影響。
發(fā)明內(nèi)容
本發(fā)明主要解決的技術問題是如何提高圖像分類的精確度和泛化能力,以滿足實際的工程需求。為解決上述技術問題,本申請公開一種圖像分類模型的訓練方法及圖像分類方法、存儲介質(zhì)。
根據(jù)第一方面,一種實施例中提供一種圖像分類模型的訓練方法,包括:建立關于一分類對象的第一數(shù)據(jù)集和第二數(shù)據(jù)集,所述第一數(shù)據(jù)集包含多幅標注有分類標簽的第一圖像,所述第二數(shù)據(jù)集包含多幅沒有標注分類標簽的第二圖像;根據(jù)所述第一數(shù)據(jù)集對所述第二數(shù)據(jù)集中的所述第二圖像進行分類標簽的預測,得到所述第二圖像對應的分類標簽,并根據(jù)所述第二圖像及其對應的分類標簽得到標注有分類標簽的第三圖像以建立第三數(shù)據(jù)集;利用所述第一數(shù)據(jù)集和所述第三數(shù)據(jù)集對預設的深度神經(jīng)網(wǎng)絡進行訓練,學習得到圖像分類模型。
所述根據(jù)所述第一數(shù)據(jù)集對所述第二數(shù)據(jù)集中的所述第二圖像進行分類標簽的預測,得到所述第二圖像對應的分類標簽,并根據(jù)所述第二圖像及其對應的分類標簽得到標注有分類標簽的第三圖像以建立第三數(shù)據(jù)集,包括:從所述第一數(shù)據(jù)集中選取多幅第一圖像,對預設的網(wǎng)絡模型進行訓練,得到預測模型;從所述第二數(shù)據(jù)集中選取多幅第二圖像,根據(jù)所述預測模型對所選取的第二圖像進行分類標簽的預測處理,得到各所選取的第二圖像的預測標簽;對各幅第二圖像的預測標簽進行標簽銳化處理,得到相應的第二圖像的分類標簽;對各選取的第二圖像及其對應的分類標簽進行處理,得到第三圖像及其對應的分類標簽,并根據(jù)第三圖像及其對應的分類標簽建立第三數(shù)據(jù)集。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳力維智聯(lián)技術有限公司;南京中興力維軟件有限公司,未經(jīng)深圳力維智聯(lián)技術有限公司;南京中興力維軟件有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010250560.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





