[發明專利]基于流形學習和梯度提升模型的圖片偏多標簽分類方法有效
| 申請號: | 202010023677.2 | 申請日: | 2020-01-09 |
| 公開(公告)號: | CN111259938B | 公開(公告)日: | 2022-04-12 |
| 發明(設計)人: | 陳剛;強宇周;王皓波;諶晨;陳珂;胡天磊;壽黎但;伍賽 | 申請(專利權)人: | 浙江大學 |
| 主分類號: | G06V10/764 | 分類號: | G06V10/764;G06K9/62 |
| 代理公司: | 杭州求是專利事務所有限公司 33200 | 代理人: | 林超 |
| 地址: | 310058 浙江*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 流形 學習 梯度 提升 模型 圖片 標簽 分類 方法 | ||
本發明公開了一種基于流形學習和梯度提升模型的圖片偏多標簽分類方法。從訓練數據集構建一個加權圖,通過求解以上第一最小化模型獲得非負權重矩陣,根據加權圖建立第二最小化模型并求解獲得重構標簽矩陣,根據重構標簽矩陣將訓練數據集換構造并訓練二值相關模型,預測得標簽矩陣;對圖片的特征向量矩陣建立回歸器最小化求解,用迭代預測結果矩陣增強特征向量矩陣,結合負梯度矩陣構造數據集并訓練學習獲得弱回歸器,求和所有弱回歸器,得最終回歸器,對預待測圖片處理判斷。本發明能夠充分地利用圖片偏多標簽數據之間的相關性來提升圖片的多標簽分類預測性能,可實現偏標簽數據的消歧,提高了準確度和魯棒性,其性能優于現有的圖片偏多標簽方法。
技術領域
本發明涉及標簽分類中的偏多標簽問題,尤其是涉及了一種基于流形學習和梯度提升的兩階段偏多標簽學習方法。
背景技術
在圖片多標簽分類問題中,一個圖片能夠同時關聯多個標簽。傳統圖片多標簽分類問題中的一個常見假設是訓練數據集中的每個圖片都被精確標記,即是有監督的。不幸的是,在許多真實的圖片多標簽分類問題中,無噪聲的標簽是很難獲得的。相比之下,獲取一組候選標簽是非常容易的。這類問題被定義為圖片的偏多標簽學習問題(PartialMulti-Label Learning,PML)。
PML的基本假設是圖片的正確標簽被隱藏在了候選標簽集中,并且它對學習器是不可見的。最具直覺性的PML方法是將所有候選標簽視為有效標簽。然后,PML問題可以通過任何現成的多標簽學習算法來解決,例如:二值相關算法(Binary Relevance,BR),分類器鏈,CPLST等等。但是,這樣的策略忽略了候選標簽集中的噪聲標簽,這可能導致標簽相關性提取不充分,反過來又影響了預測性能。
為了解決這個問題,研究者提出了一些PML方法。其中一些方法注重消歧性質,通過為每個候選標簽分配置信度值來估計它是正確標簽的可能性,例如PML-lc和PML-fp,其中置信度得分是通過最小化置信度加權排名損失來計算的。但是,當假陽性標簽的比例很高時,由于其選擇性優化策略,算法容易出錯。PARTICLE方法利用特征空間中的最近鄰居,通過迭代式的標簽傳播技術來識別具有高標簽置信度的可信標簽。接下來,它應用點對標簽排序技術來學習得到多標簽預測器。但是,它只能夠提取二階標簽相關性,因此在復雜數據集性能較差。fPML是另一種流行的PML方法,專注于探索標簽相關性。fPML遵循經典的標簽投影方法模式,只能處理標簽空間高度稀疏的數據集。現有的PML方法都專注于候選標簽集消歧或標簽相關性提取中的其中一個方面,因此這些方法的預測性能有限。
發明內容
針對現有技術的不足,本發明的目的在于一種提供基于流形學習和梯度提升算法的偏多標簽算法,針對圖片處理,解決了圖片中多個實物物體的同時分類識別問題。
本發明所采用的技術方案如下:
第一階段,首先進行標簽消歧,包括步驟1和步驟2:
步驟1:
首先從預先給定的訓練數據集中構建一個加權圖其中,V代表圖片特征向量的集合,V={xi|1≤i≤n},xi表示第i個圖片的特征向量,i表示圖片的序數,n表示訓練數據集中圖片的總數;E代表每兩個圖片之間的連接關系的集合,E={(xi,xj)|i≠j,xj∈kNN(xi)},kNN(xi)表示到第i個圖片的特征向量xi距離最近的前k個圖片的特征向量的集合,(xi,xj)表示第j個圖片和第i個圖片具有連接關系;W為非負權重矩陣,W=[wij]n×n,其中wij表示第j個圖片對第i個圖片的權重;
本發明所述的距離為歐式距離。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江大學,未經浙江大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010023677.2/2.html,轉載請聲明來源鉆瓜專利網。





