[發明專利]一種基于主動半監督字典學習的圖像分類方法有效
| 申請號: | 202110286617.4 | 申請日: | 2021-03-17 |
| 公開(公告)號: | CN112861999B | 公開(公告)日: | 2023-09-19 |
| 發明(設計)人: | 楊猛;鐘琴 | 申請(專利權)人: | 中山大學 |
| 主分類號: | G06V10/764 | 分類號: | G06V10/764;G06V10/774;G06N3/0895 |
| 代理公司: | 廣州粵高專利商標代理有限公司 44102 | 代理人: | 劉俊 |
| 地址: | 510275 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 主動 監督 字典 學習 圖像 分類 方法 | ||
1.一種基于主動半監督字典學習的圖像分類方法,其特征在于,包括以下步驟:
S1:獲取訓練樣本集,將訓練樣本集分類為有標簽樣本集和無標簽樣本集;
S2:根據有標簽樣本集和無標簽樣本集構建初始的半監督字典模型;
S3:根據半監督字典模型分別構建有標簽樣本集和無標簽樣本集的判別表示;
有標簽樣本集的判別表示為:
其中,令表示有標簽樣本集,為類別個數,為第個類別的第個樣本,為第個類別的樣本數量;表示訓練得到的半監督字典模型,為第個類別的子字典;為類共性表示系數矩陣,,是通過得到的類共性編碼系數矩陣,,是樣本特殊性編碼系數向量,和均為標量;
無標簽樣本集的判別表示為:
其中,為第個無標簽樣本的類估計概率,滿足且,為通過得到的編碼系數向量,為標量;
S4:根據有標簽樣本集和無標簽樣本集的判別表示構建圖像分類目標函數;構建得到的圖像分類目標函數為:
其中,表示無標簽樣本的類別估計概率矩陣;表示無標簽樣本集通過半監督字典模型得到的判別表示編碼系數矩陣;
S5:結合主動學習對圖像分類目標函數進行更新,得到更新好的圖像分類目標函數,將更新好的圖像分類目標函數用于圖像分類。
2.根據權利要求1所述的一種基于主動半監督字典學習的圖像分類方法,其特征在于,通過基于注意力機制的標簽估計算法得到的類估計概率,具體步驟為:
首先計算在每個子字典上的重構誤差,得到的重構誤差向量,再以相同的公式計算第個無標簽樣本的重構誤差,得到的重構誤差向量,
然后通過以下公式分別計算得到的自注意力值:
,
并通過以下公式計算第個無標簽樣本的類估計置信度:
最后通過以下公式計算的類估計概率:
其中,表示第個無標簽樣本與第個類別的第個有標簽樣本的自注意力值,表示第個無標簽樣本與第個無標簽樣本的自注意力值,,是一個常量,為無標簽樣本的數量。
3.根據權利要求2所述的一種基于主動半監督字典學習的圖像分類方法,其特征在于,通過固定更新,固定更新,以及固定更新,從而更新圖像分類目標函數;
其中,表示類共性表示系數矩陣,表示樣本特殊性表示系數矩陣,表示無標簽樣本集通過半監督字典模型得到的判別表示編碼系數矩陣。
4.根據權利要求3所述的一種基于主動半監督字典學習的圖像分類方法,其特征在于,
當固定更新時,將圖像分類目標函數簡化為:
當固定更新時,將圖像分類目標函數簡化為標準的稀疏編碼問題:
當固定更新時,將圖像分類目標函數簡化為:
。
5.根據權利要求3所述的一種基于主動半監督字典學習的圖像分類方法,其特征在于,通過以下公式計算無標簽樣本集通過半監督字典模型得到對應的最優編碼表示:
則無標簽樣本集對應的類別估計為:
其中,,是與類別相關的系數向量。
6.根據權利要求3所述的一種基于主動半監督字典學習的圖像分類方法,其特征在于,半監督字典模型的更新具體包括以下步驟:
S5.1:預設標注預算;
S5.2:根據標注預算通過主動學習的度量策略函數從無標簽樣本集中選出待標注子集,并對待標注子集進行標記,得到有標簽子集;
S5.3:根據有標簽子集擴充有標簽樣本集和縮減無標簽樣本集;
S5.4:利用擴充后的有標簽樣本集和縮減后的無標簽樣本集更新半監督字典模型;
S5.5:判斷是否達到迭代結束條件;
若是,則完成對半監督字典模型的更新;
若否,則返回步驟S5.2進行下一輪迭代。
7.根據權利要求6所述的一種基于主動半監督字典學習的圖像分類方法,其特征在于,在步驟S5.2中,通過以下公式選出top-K個待標記的無標簽樣本組成待標注子集:
。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中山大學,未經中山大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110286617.4/1.html,轉載請聲明來源鉆瓜專利網。





