[發明專利]一種融合組稀疏約束和圖趨勢過濾的噪聲容錯多標簽分類方法有效
| 申請號: | 202010411275.X | 申請日: | 2020-05-15 |
| 公開(公告)號: | CN111626344B | 公開(公告)日: | 2022-08-26 |
| 發明(設計)人: | 許磊;陳蕾;李偉澤;宋傳承;林騰濤 | 申請(專利權)人: | 南京郵電大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N20/00 |
| 代理公司: | 南京蘇高專利商標事務所(普通合伙) 32204 | 代理人: | 柏尚春 |
| 地址: | 210012 江蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 融合 稀疏 約束 趨勢 過濾 噪聲 容錯 標簽 分類 方法 | ||
1.一種融合組稀疏約束和圖趨勢過濾的噪聲容錯多標簽分類方法,其特征在于,包括以下步驟:
(1)抽取訓練集樣本數據的特征表示,訓練集中的每個樣本都帶有事先標注好的語義標簽,并基于特征數據以及標簽數據建立融合組稀疏約束和圖趨勢過濾的噪聲容錯多標簽分類數學模型;
(2)通過ADMM算法求解提出的數學模型,得到分類器;
(3)基于步驟(2)中學得的分類器,預測未知樣本的標簽向量;
所述步驟(1)包括以下步驟:
(11)定義與Y=[y1;y2;...;yi;...;yn]∈{0,1}n×c分別為輸入的多標簽特征數據以及標簽數據,其中xi為維度為d的第i個樣本的特征向量,yi表示維度為c的第i個樣本的標簽向量;如果樣本帶有某個標簽,則其標簽向量中的對應元素為1,反之為0;對于任意矩陣定義其L1范數,L2范數以及L2,1范數如下:
(12)建立融合組稀疏約束和圖趨勢過濾的噪聲容錯多標簽分類模型如下:
其中,為基于組稀疏約束的線性回歸損失函數,和為特征選擇項,為圖趨勢過濾正則化項,λ、η和μ為正則化項參數,和為權重矩陣,且Q作為分類器被用于預測樣本標簽。
2.根據要求1所述的一種融合組稀疏約束和圖趨勢過濾的噪聲容錯多標簽分類方法,其特征在于,步驟(12)所述的的構造過程如下:
定義相似度矩陣利用高斯核函數計算兩個樣本特征之間的關聯性,則A中第i行第j個元素ai,j的計算方法定義如下:
其中,ai,j代表xi和xj之間的相似度,ξ為高斯核寬度;
對于A中的第i行ai=[ai,1,ai,2,...,ai,n],定義前k個最大的值所對應的樣本的特征向量與xi相似,并用關聯矩陣S∈{-1,0,1}ε×n記錄所有樣本之間特征的相關性信息,其中,ε為關聯對的數量;若xi與xj相似,則在S中增加一行記錄,令該行的第i個元素為-1,第j個元素為1,行內其他元素為0;
基于關聯矩陣S定義基于組稀疏約束的圖趨勢過濾正則化項如下:
和用于學習標簽共有特征以及標簽特有特征,且
3.根據要求2所述的一種融合組稀疏約束和圖趨勢過濾的噪聲容錯多標簽分類方法,特征在于,所述步驟(2)包括以下步驟:
(21)將各正則化項代入公式(4),并將其轉化成如下增廣拉格朗日函數形式:
其中,ρ為懲罰因子,為拉格朗日乘子;
(22)利用隨機數初始化M、Q、W、U,對多標簽數據進行歸一化處理;
(23)設定最大迭代次數T,迭代求解M、Q、W、U,直至達到最大迭代次數T,或是目標函數收斂,即第t次迭代所對應的目標函數的值與第t-1次迭代所對應的目標函數的值之差小于10-3時,迭代完成;此時所得到的M、Q、W即為公式(12)的解。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京郵電大學,未經南京郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010411275.X/1.html,轉載請聲明來源鉆瓜專利網。





