[發明專利]一種基于主動半監督字典學習的圖像分類方法有效
| 申請號: | 202110286617.4 | 申請日: | 2021-03-17 |
| 公開(公告)號: | CN112861999B | 公開(公告)日: | 2023-09-19 |
| 發明(設計)人: | 楊猛;鐘琴 | 申請(專利權)人: | 中山大學 |
| 主分類號: | G06V10/764 | 分類號: | G06V10/764;G06V10/774;G06N3/0895 |
| 代理公司: | 廣州粵高專利商標代理有限公司 44102 | 代理人: | 劉俊 |
| 地址: | 510275 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 主動 監督 字典 學習 圖像 分類 方法 | ||
本發明提供一種基于主動半監督字典學習的圖像分類方法,包括以下步驟:S1:獲取訓練樣本集,將訓練樣本集分類為有標簽樣本集和無標簽樣本集;S2:構建初始的半監督字典模型;S3:分別構建有標簽樣本集和無標簽樣本集的判別表示;S4:構建圖像分類目標函數;S5:結合主動學習對圖像分類目標函數進行更新,得到更新好的圖像分類目標函數,將更新好的圖像分類目標函數用于圖像分類。本發明提供一種基于主動半監督字典學習的圖像分類方法,通過整合主動學習機制使得圖像分類目標函數的更新更加高效并且更適用于現實場景,能夠有效地利用大量無標簽樣本,解決了目前的圖像分類方法還無法有效地利用大量無標簽樣本的問題。
技術領域
本發明涉及圖像分類技術領域,更具體的,涉及一種基于主動半監督字典學習的圖像分類方法。
背景技術
現實世界中,我們迫切需要以簡單、快速有效的方式收集、分類和組織不斷激增的數字圖像。目前,監督學習模型在這方面已經取得了不錯的研究進展,但是其性能通常嚴重依賴有標簽樣本的數量和質量。為了獲得良好的監督學習模型性能,人們通常傾向于通過設計更深更復雜的網絡架構與依賴于更好更大型的有標簽樣本。但是,有標簽樣本的獲得所花費的代價通常是十分昂貴的,而無標簽樣本卻相對廉價易得,目前的圖像分類方法還無法有效地利用大量無標簽樣本。
現有技術中,如2020-07-07公開的中國專利,一種基于注意力機制的沙粒圖像分類方法,公開號為CN111382676A,引入了卷積神經網絡和注意力機制,在提高沙粒圖像分類準確率的同時,也加快了分類的速度,但是無法有效地利用大量無標簽樣本。
發明內容
本發明為克服目前的圖像分類方法還無法有效地利用大量無標簽樣本的技術缺陷,提供一種基于主動半監督字典學習的圖像分類方法。
為解決上述技術問題,本發明的技術方案如下:
一種基于主動半監督字典學習的圖像分類方法,包括以下步驟:
S1:獲取訓練樣本集,將訓練樣本集分類為有標簽樣本集和無標簽樣本集;
S2:根據有標簽樣本集和無標簽樣本集構建初始的半監督字典模型;
S3:根據半監督字典模型分別構建有標簽樣本集和無標簽樣本集的判別表示;
S4:根據有標簽樣本集和無標簽樣本集的判別表示構建圖像分類目標函數;
S5:結合主動學習對圖像分類目標函數進行更新,得到更新好的圖像分類目標函數,將更新好的圖像分類目標函數用于圖像分類。
優選的,有標簽樣本集的判別表示為:
其中,令A=[A1,...,Ac]表示有標簽樣本集,C為類別個數,ai,j為第i個類別的第j個樣本,ni為第i個類別的樣本數量;D=[D1,...,Dc]表示訓練得到的半監督字典模型,Di為第i個類別的子字典;X為類共性表示系數矩陣,xi是Ai通過Di得到的類共性編碼系數矩陣,vi,j是樣本特殊性編碼系數向量,λ和γ均為標量。
優選的,無標簽樣本集的判別表示為:
其中,pi,k為第k個無標簽樣本bk的類估計概率,pi,k滿足0≤pi,k≤1且為bk通過Di得到的編碼系數向量,β為標量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中山大學,未經中山大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110286617.4/2.html,轉載請聲明來源鉆瓜專利網。





