[發明專利]一種基于正則化的半監督弱標簽分類方法在審
| 申請號: | 202010700950.0 | 申請日: | 2020-07-20 |
| 公開(公告)號: | CN112085049A | 公開(公告)日: | 2020-12-15 |
| 發明(設計)人: | 丁家滿;劉楠;周蜀杰;李潤鑫;賈連印 | 申請(專利權)人: | 昆明理工大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 昆明明潤知識產權代理事務所(普通合伙) 53215 | 代理人: | 王鵬飛 |
| 地址: | 650093 云*** | 國省代碼: | 云南;53 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 正則 監督 標簽 分類 方法 | ||
1.一種基于正則化的半監督弱標簽分類方法,其特征在于:首先根據標簽相關性對弱標簽實例的缺失標簽進行初步預估,度量預估后弱標簽實例的經驗損失;然后利用所有訓練實例構造鄰域圖,從實例相似性和標簽相關性角度構建基于平滑性假設的正則化項;接下來利用預估后的弱標簽實例結合無標簽實例訓練半監督弱標簽分類模型;最后進行模型求解,對無標簽實例的標簽進行預測。
2.根據權利要求1所述的基于正則化的半監督弱標簽分類方法,其特征在于具體步驟為:
Step1:輸入訓練數據集U,測試數據集T;
Step2:讀取訓練數據集U中實例的特征和標簽信息,生成實例特征矩陣X和初始標簽矩陣Y;
其中,X=[x1,x2,...,xn]∈Rd×n為實例特征矩陣,xi∈Rd為第i個實例的特征向量,n為實例數,d為特征類別數,Y=[y1,y2,...,yn]∈Rc×n為初始標簽矩陣,yi∈Rc為第i個實例的標簽向量,c為標簽類別數;
設n=l+μ,前l個實例為帶有部分標簽信息的弱標簽實例,后μ個實例為標簽信息完全未知的無標簽實例;
Step3:定義分類模型的一般形式為:f(x)=WTx+b,其中,W=[w1,w2,...,wc]∈Rd×c是預測矩陣,b∈Rc是標簽偏差,f(x)∈Rc是實例x的預測標簽向量;
Step4:根據標簽相關性對弱標簽實例的缺失標簽進行初步預估,度量預估后弱標簽實例的經驗損失,具體為
Step4.1:基于余弦相似度,計算標簽相關矩陣
其中,L(c1,c2)是標簽c1,c2的相關度,是Y的第c1行,是Y的第c2行;
利用標簽相關矩陣對前l個弱標簽實例xi的缺失標簽進行初步預估:其中,yi表示實例i的標簽向量,T表示轉置,L(·,c)表示標簽相關矩陣L的第c列;
當yic=0時,為保證將歸一化為
Step4.2:最小化前l個弱標簽實例的經驗損失,定義損失函數Ω1(f)為:
式(1)中,tr()是矩陣的跡運算,是初步預估后的實例標簽矩陣,F=[f(x1),f(x2),...f(xn)]=WTX+beT是預測標簽矩陣,e∈Rn是所有元素為1的向量,V∈Rn×n是對角矩陣,前l個對角元素為1,后μ個對角元素為0;
Step5:利用所有訓練實例構造鄰域圖,從實例相似性和標簽相關性角度構建基于平滑性假設的正則化項,具體為:
Step5.1:基于n個實例樣本構造加權鄰域圖G,G中每一個頂點對應一個實例xi,xi和xp之間的邊表示xi是xp的k近鄰或xp是xi的k近鄰;
計算實例相似矩陣Ni是實例i的k近鄰實例集,σ是實例特征矩陣X中任意兩點間歐氏距離的平均值,使用kd-tree有效搜索每個實例的k近鄰;
Step5.2:正則化項Ω2(f)定義為:
Ω2(f)=tr(WTXMSXTW) (2)
式(2)中,MS=Λ-S為S對應近鄰圖上的規范化Laplacian矩陣,Λ是對角矩陣,
Step5.3:正則化項Ω3(f)定義為:
Ω3(f)==tr(XTWMLWTX) (3)
式(3)中,ML=Λ′-L為L對應近鄰圖上的規范化Laplacian矩陣,Λ′是對角矩陣,
Step6:根據Step3.2、Step4.2和Step4.3可得Φ(f)為:
Φ(f)=Ω1(f)+αΩ2(f)+βΩ3(f) (4)
通過Φ(f)最小化,求解出W和b,f(x)=WTx+b為實例x的預測標簽向量;
Step7:對Step6中建立的模型求解,其結果為:
其中,
Step8:根據Step7中模型求解結果,對測試數據集T中無標簽實例的標簽進行預測,輸入實例x,得到預測標簽向量f(x)。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于昆明理工大學,未經昆明理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010700950.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:自動夾緊快速切割機構
- 下一篇:基于加權TOPSIS法的垃圾污染問題分責方法





