[發明專利]一種基于自適應權重學習的補子空間表示非均衡分類方法在審
| 申請號: | 202211335234.2 | 申請日: | 2022-10-28 |
| 公開(公告)號: | CN115511003A | 公開(公告)日: | 2022-12-23 |
| 發明(設計)人: | 李艷婷;王帥;劉巖;金軍委;陶紅偉;朱付保 | 申請(專利權)人: | 鄭州輕工業大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06F17/16 |
| 代理公司: | 北京睿智保誠專利代理事務所(普通合伙) 11732 | 代理人: | 王卓 |
| 地址: | 450001 河南省鄭*** | 國省代碼: | 河南;41 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 自適應 權重 學習 空間 表示 均衡 分類 方法 | ||
本發明公開了一種基于自適應權重學習的補子空間表示非均衡分類方法,應用于數據分類技術領域,用于解決現有的分類技術無法高精度識別少數類樣本的問題,方法包括以下步驟:對非均衡數據集進行預處理、獲取每個訓練樣本的權重、基于補子空間計算得到非均衡分類模型、對非均衡分類模型求解得到最優表示系數、對測試樣本集中測試樣本的標簽進行分類。本發明在協同表示模型中引入了由補子空間誘導的正則項,并且根據原始數據的類間和類內密度信息自適應地獲取每個訓練樣本的權重,有效剔除了噪聲以及離群點對分類結果的影響,為少數類樣本賦予更大的權重,解決了現有的分類方法無法對少數類準確分類的缺陷。
技術領域
本發明涉及數據分類技術領域,更具體的說是涉及一種基于自適應權重學習的補子空間表示非均衡分類方法。
背景技術
現實生活中欺詐檢測、網絡入侵、信用風險識別等眾多領域涉及到非均衡分類。目前的分類技術高度依賴數據的均衡分布,對少數類的識別率總是不能取得令人滿意的結果。實際上少數類的誤分類成本更高,例如,在信用評估中,信用差的用戶遠遠少于信用好的用戶,如果分類錯誤,可能造成銀行貸款資金的重大損失。因此,在實際應用中,提高少數類樣本的識別精度至關重要。
現有的非均衡分類方法可以大致分為基于算法層面和基于數據層面的方法。基于數據層面的方法主要是通過對少數類樣本進行欠采樣,對多數類樣本采用過采樣的方法使原本的非均衡數據集均衡化。但是,這些數據層面的方法都會對原始數據造成損害,并不會顯著提高最終的識別精度。算法層面的方法比數據層面方法的性能更好,但是需要仔細的調整參數以獲得最佳的分類性能。在眾多算法層面的方法中,協同表示分類方法(Collaborative representation based classification,CRC)由于其自身簡單、高效、以及極低的計算復雜度表現出極大的優勢,然而協同表示分類方法很大程度上依賴于數據的均衡分布,無法準確的識別少數類樣本。因此,如何提高少數樣本的識別精度以及分類準確率是本領域技術人員亟需解決的問題。
發明內容
有鑒于此,本發明提供了一種基于自適應權重學習的補子空間表示非均衡分類方法,選用CRC作為基礎模型,延續它已有的優勢,同時提高CRC對少數類樣本的分類準確率,解決現有的CRC無法準確識別少數類樣本的問題。
為了實現上述目的,本發明提供如下技術方案:
一種基于自適應權重學習的補子空間表示非均衡分類方法,包括以下步驟:
S1、對總類別數為N的非均衡數據集進行預處理,獲得訓練樣本集H以及測試樣本集;
S2、基于密度獲取訓練樣本集H中每個訓練樣本的權重;
S3、根據每個訓練樣本的權重,基于補子空間計算得到非均衡分類模型;
S4、對非均衡分類模型求解得到最優表示系數;
S5、根據最優表示系數的重構誤差對測試樣本集中測試樣本的標簽進行分類。
上述方法,可選的,S1具體為:
S11、通過交叉驗證法將總類別數為N的非均衡數據集隨機分為z份,選擇其中e份作為原始訓練集,f份作為原始測試集,e+f=z;
S12、將e份原始訓練集和f份原始測試集隨機交叉驗證g次,得到g組原始訓練樣本集和g組原始測試樣本集;
S13、將g組原始測試樣本集和g組原始訓練樣本集轉化為列向量,進行歸一化處理,得到測試樣本集和訓練樣本集。
可選的,S2具體為:
S21、獲取每一類訓練樣本的個數Mik,Mik為第i個樣本所屬類別k中的樣本總數,每個訓練樣本的初步權重為
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于鄭州輕工業大學,未經鄭州輕工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211335234.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:電池翻轉開夾裝置
- 下一篇:一種智能運動墊計次方法及智能運動墊





