[發明專利]基于多子空間表示的偏多標記學習方法在審
| 申請號: | 202010412162.1 | 申請日: | 2020-05-15 |
| 公開(公告)號: | CN111581469A | 公開(公告)日: | 2020-08-25 |
| 發明(設計)人: | 馮松鶴;李浥東;李子薇;金一;郎叢妍 | 申請(專利權)人: | 北京交通大學 |
| 主分類號: | G06F16/906 | 分類號: | G06F16/906;G06N20/00 |
| 代理公司: | 北京市商泰律師事務所 11255 | 代理人: | 黃曉軍 |
| 地址: | 100044 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 空間 表示 標記 學習方法 | ||
本發明提供了一種基于多子空間表示的偏多標記學習方法。該方法包括利用真實標記矩陣構建標記子空間,利用特征映射矩陣構建特征子空間,通過標記子空間和特征子空間學習得到基于多子空間表示的偏多標記學習模型;對基于多子空間表示的偏多標記學習模型進行交替優化訓練學習,求解基于多子空間表示的偏多標記學習模型,得到最優的預測模型;將未知樣本輸入到最優的預測模型,最優的預測模型輸出未知樣本的標記信息。本發明解決了特征存在噪聲和冗余標記的問題,使用映射矩陣將特征空間映射到子空間,減少特征噪聲對預測模型的影響;使用矩陣分解技術將標記空間降維到標記子空間,使用圖拉普拉斯約束標記子空間,消除冗余標記噪聲對預測模型的影響。
技術領域
本發明涉及計算機應用技術領域,尤其涉及一種基于多子空間表示的偏多標記學習方法。
背景技術
近年來,多標記學習廣泛應用在多媒體內容自動標注、生物信息學、Web挖掘、信息檢檢索和個性化推薦等領域,但是由于數據集標記信息的不準確性,導致多標記模型的預測準確度下降。在多標記學習的實際應用中,由于遮擋、光線等問題,數據特征也不可避免的存在噪聲問題。為了更好地解決訓練數據標記存在冗余標記的問題,2018年學者將弱監督框架下的標記存在噪聲的多標記學習問題分離成為偏多標記學習問題,近兩年來,越來越多偏多標記學習的方法被發表在國際頂尖會議上。
現有技術中的偏多標記學習解決方法主要可以分為兩類:基于統一框架的偏多標記學習方法偏多標記學習方法以及基于兩階段的偏多標記學習方法。
基于統一框架策略的偏多標記學習是把整個模型的訓練過程作為一個整體,優化候選標記集合(即含有冗余噪聲的標記集合)的過程和學習預測模型的過程是同時進行的,是在一個統一的框架里學習。有方案利用標記置信度來度量每個候選標記成為真實標記的概率,并根據標記的排名得到真實標簽(PML-fp和PML-lc)。也有方案提出一種基于特征誘導的偏多標記學習算法,該算法利用標記與特征之間的潛在依賴關系識別噪聲標簽并訓練預測模型(fPML)。還有方案提出在偏多標記學習的框架中使用低秩稀疏分解模型,將觀測的標記矩陣分解為低秩的真實標記矩陣和稀疏的噪聲標記矩陣,訓練過程中同時得到真實標記矩陣以及預測模型(PML-LRS)。
上述現有技術中的基于統一框架的偏多標記學習方法的缺點為:直接使用候選標記集合進行預測模型學習時,模型的準確性會受到候選標記集合中冗余標記所占比例的影響,在冗余標記較多時,模型的準確性會大大下降。
基于兩階段策略的偏多標記學習包括可靠標記的選擇階段和預測模型學習階段。該類方法第一階段利用各種消歧策略獲得候選標記集合中較為可靠的標記,第二階段使用上述可靠標記作為真實標記進行預測模型的學習。有方案在第一個階段通過標記傳播算法賦予每個候選標記的不同的標記置信度,在第二階段利用具有高標記置信度的可信標簽,通過虛擬標記劃分或最大后驗(MAP)訓練預測模型(PARTICLE)。還有方案第一階段利用標記與特征之間的依賴關系得到標記置信度,然后在第二階段利用標記置信度的梯度增強算法來學習預測模型(DRAMA)。
上述現有技術中的基于兩階段策略的偏多標記學習方法缺點為:在第一階段獲得的可靠標記對于預測模型有著很大的影響,在可靠標記不準確、與真實標記差別較大的情況下第二階段模型的預測結果則會出現較大的偏差。而且現有的偏多標記學習方法并沒有考慮到特征也會存在少量噪聲,特征噪聲也會對預測模型的準確性造成影響。
發明內容
本發明的實施例提供了一種基于多子空間表示的偏多標記學習方法,以克服現有技術的缺點。
為了實現上述目的,本發明采取了如下技術方案。
一種基于多子空間表示的偏多標記學習方法,包括:
利用真實標記矩陣構建標記子空間,利用特征映射矩陣構建特征子空間,通過所述標記子空間和特征子空間學習得到基于多子空間表示的偏多標記學習模型;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京交通大學,未經北京交通大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010412162.1/2.html,轉載請聲明來源鉆瓜專利網。





