[發明專利]基于深度子空間自表達的多標簽分類方法有效
| 申請號: | 202010614744.8 | 申請日: | 2020-06-30 |
| 公開(公告)號: | CN111860614B | 公開(公告)日: | 2023-09-19 |
| 發明(設計)人: | 楊博 | 申請(專利權)人: | 西安工程大學 |
| 主分類號: | G06F18/241 | 分類號: | G06F18/241;G06F18/2431;G06F18/10;G06N3/0455;G06N3/082 |
| 代理公司: | 西安弘理專利事務所 61214 | 代理人: | 弓長 |
| 地址: | 710048 陜*** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 深度 空間 表達 標簽 分類 方法 | ||
本發明公開了一種基于深度子空間自表達的多標簽分類方法,具體為:首先利用深度子空間神經網絡結構表示數據間的相似程度,接著利用數據相似性與訓練數據的標簽集合構建數據的實數值標簽預測值,最后利用深度分類網絡實現多標簽數據的分類。本發明的基于深度子空間自表達的多標簽分類方法,利用數據間的相似程度構建數據的實數值標簽,再利用深度神經網絡可自動對無標注的多標簽數據進行標注,提高了多標簽數據分類的精度與效果。
技術領域
本發明屬于數據挖掘與模式識別技術領域,涉及一種基于深度子空間自表達的多標簽分類方法。
背景技術
隨著互聯網與存儲技術的不斷提高,數據的收集與呈現形式更加便捷與豐富。傳統的二值分類,即將數據與互不相交的標簽集合中的一個標簽元素相對應的分類方式無法有效表達現實中的許多問題。例如例如一位患者可能患有多種疾病,一篇新聞報道可能涉及多個領域,一位用戶可能購買多種商品等。這種同時具有多重語義的分類問題為多標簽分類問題。多標簽分類已成功應用于多媒體內容的自動標注、關聯規則挖掘、信息檢索、標簽推薦、推薦系統等領域。
多標簽分類概念自提出以來,一直是國內外的研究熱點。Wright等人提出基于稀疏表示的分類(Classification?Based?on?Sparse?Representation,SRC)算法(文獻1:Wright?J,Yang?AY,Ganesh?A,et?al.Robust?face?recognition?via?sparserepresentation[J].IEEE?Transactions?on?Pattern?AnalysisMachine?Intelligence,2008,31(2):210-227.),將稀疏表示理論應用到分類中。由于超完備字典能用盡可能稀疏的方式表示數據,并且冗余系統對噪聲與誤差的容忍更為穩健,因而算法取得較為顯著的效果。由于基于稀疏表示的分類算法取得較為顯著的效果,學者們將其改編為一系列基于稀疏表示的多標簽分類算法。這一系列的算法通過計算測試樣本與所有訓練樣本之間的重構關系,獲得每一個訓練樣本對應的系數,這些系數構成對測試數據的表示。這樣的處理過程,可充分考慮測試樣本的全局信息,但并沒有考慮樣本的局部信息。此外,這一類方法未能考慮標簽之間的關聯。
張敏靈等人將K近鄰與最大后驗概率原理結合,提出基于K近鄰的多標簽分類算法(Multi-label?K?Nearest?Neighbor,ML-KNN)(文獻2:Zhang?M?L,Zhou?Z?H.ML-KNN:Alazylearning?approach?to?multi-label?learning[J].Pattern?Recognition,2007,40(7):2038-2048.)。后續又涌現一系列針對該算法沒有考慮標簽相關性、類別不一致、類別不平衡等問題提出的改進算法和將KNN與其它算法或理論相結合的算法。雖然基于局部的多標簽分類系列算法在實際應用中取得較好的分類效果,但存在著只考慮測試數據的局部信息,未能考慮測試數據的全局信息、對噪聲和K值比較敏感、未能利用標簽間的高階關聯等缺點。
發明內容
本發明的目的是提供一種基于深度子空間自表達的多標簽分類方法,利用數據間的相似程度構建數據的實數值標簽,再利用深度神經網絡可自動對無標注的多標簽數據進行標注,提高了多標簽數據分類的精度與效果。
本發明所采用的技術方案是,基于深度子空間自表達的多標簽分類方法,具體按照如下步驟實施:
步驟1,預訓練自動編碼器神經網絡
讀取多標簽數據并進行預處理,使用深度自動編碼器神經網絡,以數據重構為目標,以經預處理的多標簽數據作為輸入數據,對輸入數據進行訓練獲得網絡參數的初始值;
步驟2,訓練深度子空間自表達神經網絡
構建深度子空間自表達神經網絡,以步驟1預訓練的結果權值作為初始值賦值于深度子空間自表達神經網絡,以數據重構誤差、線性層的權值稀疏度以及稀疏表示的重構誤差最小化為目標進行訓練,訓練深度子空間自表達神經網絡;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西安工程大學,未經西安工程大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010614744.8/2.html,轉載請聲明來源鉆瓜專利網。





