[發明專利]一種圖像數據多標簽分類方法在審
| 申請號: | 202010573202.0 | 申請日: | 2020-06-22 |
| 公開(公告)號: | CN111797911A | 公開(公告)日: | 2020-10-20 |
| 發明(設計)人: | 陳剛;胡天磊;陳珂;劉雨辰;李夢謹;王皓波;壽黎但 | 申請(專利權)人: | 浙江大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 杭州求是專利事務所有限公司 33200 | 代理人: | 邱啟旺 |
| 地址: | 310058 浙江*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 圖像 數據 標簽 分類 方法 | ||
本發明公開了一種圖像數據多標簽分類方法,該方法首先構建圖片的拓撲關系,然后用基于協作的多標簽傳播算法(CMLP)來解決半監督多標簽學習(SSML)問題,從而獲得無標記圖片的置信矩陣本發明能夠充分地利用多標簽圖像數據的多個標簽之間的相關性來提升圖片的多標簽分類預測性能,提高了準確度和魯棒性,同時能夠挖掘無監督圖像數據的分布信息,很好地解決半監督多標簽學習問題,其性能優于現有的半監督圖像數據多標簽分類方法。
技術領域
本發明涉及機器學習領域,尤其涉及一種圖像數據多標簽分類方法。
背景技術
圖像分類是應用最廣泛的機器學習問題之一。在真實世界的圖像分類應用中,一個圖像實例往往與多個標簽相關聯,并且這些標簽之間具有相關性。因此,對具有多個相關標簽的圖像進行分類是很重要的研究任務。傳統的圖片標簽分類問題中,一個常見假設是訓練數據集中的每個圖片都被精確標記。不幸的是,在許多真實問題中,雖然海量的圖像很容易獲取,圖像的標簽卻需要經過昂貴且耗時的人工標記過程才能得到。
為此,人們提出了半監督學習的方法,將大量的無標簽圖像加入到有限的有標簽圖像中一起訓練,以改進分類器的性能。標簽傳播方法就是一種基于圖的半監督分類學習方法。但是當圖像實例具有多個相關的標簽時,簡單標簽傳播并不能很好的利用這種相關性,導致了分類性能的下降。
發明內容
為了解決背景技術中存在的問題,本發明提供了一種圖像數據多標簽分類方法。
本發明的目的是通過以下技術方案來實現的:一種圖像數據多標簽分類方法,包括如下步驟:
(1)獲取有待分類的圖片集D={pici|1≤i≤n},其中,n是圖片集D中圖片的總數;圖片集D中,每張圖片上共有q個有序的待標記的標簽,總共有l個圖片已經被標記是否具有這q個標簽,被標記的圖片為pici,1≤i≤l;
(2)計算權重矩陣W,構建圖片間的圖關系,該步驟包括以下子步驟:
(2.1)將圖片集中的圖片輸入已經訓練好的卷積神經網絡VGG Net,從輸出中獲取圖片的特征向量集V={xi|1≤i≤n},其中,xi是圖片pici輸入卷積神經網絡得到的輸出,是p維列向量;
(2.2)選取超參數k,根據圖片特征向量集V計算特征向量xi的k鄰近集合kNN(xi),kNN(xi)是圖片特征向量集V中與特征向量xi歐式距離最小的k個圖片特征向量的集合;
對非負權重矩陣W=[wij]n×n,要求其滿足:
wii=0
wij≥0,j≠i,xj∈kNN(xi)
(2.3)對每個圖片特征向量xi,被其他圖片特征向量線性重建為∑j≠iwijxj,選擇權衡參數θ,權重矩陣W的線性重建誤差定義如下:
其中||·||2表示矩陣的二范數;
利用約束最小二乘規劃方法來最小化線性重建誤差Error(W),建立以下最小化模型:
s.t.wii=0
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江大學,未經浙江大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010573202.0/2.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





