[發明專利]基于全局和局部標記關系的偏多標記學習方法在審
| 申請號: | 202010411579.6 | 申請日: | 2020-05-15 |
| 公開(公告)號: | CN111582506A | 公開(公告)日: | 2020-08-25 |
| 發明(設計)人: | 馮松鶴;李浥東;孫利娟;金一 | 申請(專利權)人: | 北京交通大學 |
| 主分類號: | G06N20/00 | 分類號: | G06N20/00 |
| 代理公司: | 北京市商泰律師事務所 11255 | 代理人: | 黃曉軍 |
| 地址: | 100044 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 全局 局部 標記 關系 學習方法 | ||
1.一種基于全局和局部標記關系的偏多標記學習方法,其特征在于,包括:
構建特征信息矩陣,對所述特征信息矩陣中的特征數據進行歸一化處理,構建不精確標記矩陣;
利用低秩稀疏表示模型將所述不精確標記矩陣分解為噪聲標記矩陣和正確標記系數矩陣,利用所述噪聲標記矩陣、正確標記系數矩陣和特征信息矩陣構建所有標記的預測模型;
基于正確標記系數矩陣、噪聲矩陣和預測模型構建偏多標記學習模型,采用塊坐標下降法迭代更新方法訓練所述偏多標記學習模型,得到訓練好的預測模型;
將未見示例輸入到所述訓練好的預測模型,根據所述訓練好的預測模型輸出的預測值確定所述未見示例對應的標記。
2.根據權利要求1所述的方法,其特征在于,所述的構建特征信息矩陣和不精確標記矩陣,包括:
構建特征信息矩陣其中m表示樣本數目,d表示特征向量的維數,對特征信息矩陣X中的特征數據進行歸一化處理,構建不精確標記矩陣Y∈{0,1}m×l,其中m表示樣本數目,l表示標記數目,表示對應的已標注示例的標簽分配情況,其中yij=1表示示例xi標注了標記yj;否則,yij=0表示示例xi沒有標注標記yj。
3.根據權利要求2所述的方法,其特征在于,所述的利用低秩稀疏表示模型將所述不精確標記矩陣分解為噪聲標記矩陣和正確標記系數矩陣,利用所述噪聲標記矩陣、正確標記系數矩陣和特征信息矩陣構建所有標記的預測模型,包括:
利用低秩稀疏表示模型將觀測的不精確標記矩陣Y分解為噪聲標記矩陣Q和正確標記矩陣P,Y=P+Q,引入l1范數來約束噪聲標記矩陣Q的稀疏性,約束正確標記矩陣P為低秩,利用低秩表示構建正確標記系數矩陣P=YZ,Y表示線性跨越數據空間的字典,將P=YZ代入上面的Y=P+Q,得到Y=YZ+Q;
設偏多標記預測函數f=[f1,,f2,…fl]由l個函數組成,每個函數對應一個標簽,每個預測函數為線性函數,定義為fi(X)=Xwi,將所有標簽的預測模型W的參數定義為:遵循機器學習規則,引入損失函數來學習得到所述預測模型W。
4.根據權利要求3所述的方法,其特征在于,所述的方法還包括:
所述噪聲標記矩陣Q為稀疏矩陣,所述正確標記矩陣P為低秩矩陣,表示為:
利用低秩表示來獲取標記之間的全局關系,將秩最小化問題定義如下:
其中Y是一個線性跨越YZ數據空間的字典,是正確標記系數矩陣,其中z:,i表示標簽yi與l個標簽之間的關系系數向量,zji看作是標記yj對標記yi重構的貢獻;
設正確標記系數矩陣Z是線性相關的,引入了一個跡范數來約束正確標記系數矩陣Z是低秩的,通過對低秩的正確標簽系數矩陣Z的學習,獲得了全局標簽相關性,通過解決以下問題來訓練所有標簽的預測模型W:
s.t.Y=YZ+Q,Z≥0
引入F范數來約束所有標簽的預測模型W。
5.根據權利要求4所述的方法,其特征在于,所述的方法還包括:
如果第i個和第j個標簽的相關性越強,則wi,:與wj,:更相似;反之亦然,將標簽流形正則項定義為:
利用所述標簽流形正則項學習標簽系數矩陣Z與預測模型W之間的一致性,得到了局部標簽相關性,利用局部標記相關性提升預測模型W的性能。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京交通大學,未經北京交通大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010411579.6/1.html,轉載請聲明來源鉆瓜專利網。





