[發明專利]一種基于半監督自步學習跨任務深度網絡的圖像分類方法在審
| 申請號: | 201810346336.1 | 申請日: | 2018-04-18 |
| 公開(公告)號: | CN108764281A | 公開(公告)日: | 2018-11-06 |
| 發明(設計)人: | 紀秋佳;吳斯;余志文 | 申請(專利權)人: | 華南理工大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06K9/66;G06N3/04 |
| 代理公司: | 廣州市華學知識產權代理有限公司 44245 | 代理人: | 李斌 |
| 地址: | 510640 廣*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 樣本 標注 圖像分類 半監督 訓練集 權重 網絡 標簽 高置信度 人為設計 數據集中 隨機選取 圖像整體 網絡性能 訓練過程 原始圖像 真實標簽 初始化 學習 預設 飽和 分類 保留 預測 重復 賦予 | ||
本發明公開了一種基于半監督自步學習跨任務深度網絡的圖像分類方法,包括以下步驟:S1、從圖像整體數據集中隨機選取少量標注樣本,保留其標簽,剩下所有樣本作為未標注樣本,在整個流程中不知道其真實標簽,標注樣本的權重在訓練過程中恒為1,未標注樣本權重初始化為0,初始時只使用標注樣本作為訓練集;S2、使用訓練集訓練跨任務深度網絡;S3、根據訓練好的跨任務深度網絡,預測所有未標注樣本的偽標簽,并賦予每個未標注樣本相應權重;S4、根據自步學習范式,選取高置信度的未標注樣本,添加到訓練集中;S5、重復步驟S2?S4,直到跨任務深度網絡性能飽和或者達到預設循環次數。所述方法不需要輸入人為設計的特征,直接輸入原始圖像即可實現分類。
技術領域
本發明涉及計算機視覺領域,具體涉及一種基于半監督自步學習跨任務深度網絡的圖像分類方法。
背景技術
圖像分類在過去幾十年間一直是計算機視覺領域一個有挑戰性的任務,因為圖像的類別信息反映了人類對這些圖像的高級語義認知。傳統的方法一般是從圖片提取一些底層特征,根據圖片的標簽,有監督地訓練得到一個模型來預測圖像標簽。然而隨著移動互聯世界的發展,圖片的數量每天都在快速增長。給這些圖像作標簽成為了一件非常耗人力和耗時間的事情。因此,怎么盡可能得減少人工標注的工作量,同時又能保持分類器的性能,具有重大的意義。基于半監督的方法就是一種途徑。
在半監督的場景中,通常我們只有一小部分有標簽的樣本,還有一大部分無標簽的樣本。很多半監督的方法基于有標簽和無標簽的樣本從同一分布采樣的先驗,采用標簽傳播的方法來給無標簽的數據標簽;也有的采用增量學習的方式,用有標簽的數據得到的模型給無標簽的數據偽標簽,從中挑選高置信度的樣本,有標簽的數據和高置信度的偽標簽數據再不斷一起訓練得到新的模型;也有的采用協同學習的方式,彼此互相糾錯;還有半監督的支持向量機等方法。近幾年來,隨著深度學習的迅猛發展,也出現了一些基于深度學習的半監督方法,比如梯子網絡,半監督的對抗生成網絡等。傳統的圖像分類方法大多數為淺模型,無法處理大規模的數據集,但半監督的方法,初始時我們往往只有一小部分的訓練數據,在訓練時很容易出現網絡過擬合的情況。
發明內容
本發明的目的是針對上述現有技術的不足,提供了一種基于半監督自步學習跨任務深度網絡的圖像分類方法,所述方法只需要人為對一部分圖像進行標記即可得到具有良好分類能力的分類器,能夠有效節省人工標記圖像所花費的時間,具有分類精度高的優點。
本發明的目的可以通過如下技術方案實現:
一種基于半監督自步學習跨任務深度網絡的圖像分類方法,所述方法包括以下步驟:
S1、從圖像整體數據集中隨機選取少量的標注樣本,保留其標簽,剩下的所有樣本作為未標注樣本,在整個流程中不知道其真實標簽,標注樣本的權重在訓練過程中恒為1,未標注樣本的權重初始化為0,初始時只使用標注樣本作為訓練集;
S2、使用訓練集訓練跨任務深度網絡;
S3、根據訓練好的跨任務深度網絡,預測所有未標注樣本的偽標簽,并賦予每個未標注樣本相應的權重;
S4、根據自步學習范式,選取高置信度的未標注樣本,添加到訓練集中;
S5、重復步驟S2-S4,直到跨任務深度網絡性能飽和或者達到預設循環次數。
進一步地,步驟S1中還需要對訓練集的樣本做進一步擴充,在圖像四周加4個像素的零進行填充,然后再隨機截取一個原圖像大小的圖像。
進一步地,步驟S2中的跨任務深度網絡由一個包含32個卷積核的卷積層、9個殘差塊、一個全局平均池化層和一個softmax層依次連接組成,分為分類和聚類兩個任務,所述殘差塊由兩個相連的卷積層和一個短路連接組成,分為兩種,一種會進行下采樣,一種不會進行下采樣,會進行下采樣的殘差塊訓練流程如下:
1)輸入卷積特征圖X;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華南理工大學,未經華南理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810346336.1/2.html,轉載請聲明來源鉆瓜專利網。





