[發明專利]一種基于半監督學習的圖像多標簽分類方法有效
| 申請號: | 202010954339.0 | 申請日: | 2020-09-11 |
| 公開(公告)號: | CN112115995B | 公開(公告)日: | 2023-04-07 |
| 發明(設計)人: | 李煒;秦世祥;張樂劍;王玉龍;趙海秀;王晶 | 申請(專利權)人: | 北京郵電大學 |
| 主分類號: | G06V10/774 | 分類號: | G06V10/774;G06V10/764;G06V10/82 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100876 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 監督 學習 圖像 標簽 分類 方法 | ||
一種基于半監督學習的圖像多標簽分類方法,包括:從訓練數據集中分別提取有標簽數據和無標簽數據的訓練圖片,并構成有標簽數據集、無標簽數據集,然后為每張訓練圖片標注標簽向量;構建圖像多標簽分類網絡,將有標簽數據集和無標簽數據集中的所有訓練圖片作為訓練樣本輸入進行半監督訓練,其輸入是有標簽數據集和無標簽數據集的訓練圖片及標簽向量,輸出是訓練圖片對應各標簽的預測概率;為待分類圖片標注標簽向量,然后將待分類圖片及標簽向量輸入圖像多標簽分類網絡,并根據輸出確定待分類圖片的多個標簽。本發明屬于信息技術領域,能基于無標簽和有標簽數據組成的混合數據集實現圖像多標簽分類,充分利用標簽有效信息,有效提高網絡分類性能。
技術領域
本發明涉及一種基于半監督學習的圖像多標簽分類方法,屬于網絡通信技術領域。
背景技術
多標簽圖像分類是計算機視覺領域的一項基礎性和實踐性工作,其目標是預測圖像中出現的一系列物體標簽。它有許多現實世界的應用,包括人體屬性識別,醫學診斷識別,視頻多標簽分類以及圖像標注等。近些年來,大多數卷積神經網絡都是為了處理單標簽分類問題而設計,每個圖像只使用一個標簽來描述該圖像中最重要、最顯著的內容,比如描述一個對象或場景。然而,僅用一個標簽來標記圖像與現實應用并不相符,因為現實世界中的大多數圖像都含有多個對象或概念。因此,為了自然而全面的地描述圖像,需要建立多標簽的圖像分類模型。
隨著深度卷積神經網絡的發展,研究者們越來越多的關注網絡的深度和寬度。網絡越大、越深,其性能越好,同時網絡的參數數量也明顯增加,此時便需要更多的標記訓練樣本來防止過擬合。然而在現實場景下的深度學習問題中,準確標記海量的訓練圖像,需要大量的人工勞動和精力,成本非常高,獲得完整標記的多標簽數據集往往是困難的。要解決大量未標記數據的訓練問題,一個簡單的解決方案是丟棄所有無標簽的樣本,然而這可能會付出丟失大量的數據樣本的特征信息的代價。同時,在神經網絡的訓練過程中我們發現,知道盡可能多的正確標記的訓練數據有助于提高模型性能。另外一種解決方案是在模型訓練前,通過聚類或標簽特征相關性生成無標簽數據的標簽,進而進行監督訓練。然而,這種對無標簽樣本的預處理忽略了神經網絡對數據的特征表達且標簽的噪聲也顯著增加,因此會降低網絡的分類性能。
專利申請號CN?201910883908.4(申請名稱:一種基于ACGAN圖像半監督分類算法,申請日:2019.09.18,申請人:長沙理工大學)公開了基于ACGAN圖像半監督分類算法,解決在半監督學習中標簽過少導致分類過擬合的問題,通過ACGAN網絡中的生成器生成假數據及其對應的標簽,并把假數據放入分類器中進行分類,增加帶有標簽的數據量,從而提高分類模型的泛化能力。但這種技術方案由于分類器的分類性能原因會使生成的標簽不具備可靠性,從而使得標簽數據集引入較大的噪聲,降低模型的泛化性能。
因此,如何基于無標簽和有標簽數據組成的混合數據集實現圖像的多標簽分類,從而充分利用標簽數據的有效信息,有效提高網絡的分類性能,已成為技術人員急需解決的技術問題。
發明內容
有鑒于此,本發明的目的是提供一種基于半監督學習的圖像多標簽分類方法,能基于無標簽和有標簽數據組成的混合數據集實現圖像的多標簽分類,從而充分利用標簽數據的有效信息,有效提高網絡的分類性能。
為了達到上述目的,本發明提供了一種基于半監督學習的圖像多標簽分類方法,包括有:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京郵電大學,未經北京郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010954339.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種導電硅橡膠及其應用
- 下一篇:圖像數據的處理方法、裝置、設備及存儲介質
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





