[發明專利]一種基于自適應平衡集成與動態分層決策的多分類方法在審
| 申請號: | 201811599644.1 | 申請日: | 2018-12-26 |
| 公開(公告)號: | CN109359704A | 公開(公告)日: | 2019-02-19 |
| 發明(設計)人: | 高欣;何楊;井瀟;刁新平;任昺;紀維佳 | 申請(專利權)人: | 北京郵電大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100876 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 二分類 一對多 樣本 自適應平衡 動態分層 數據集 子模型 原始數據集 參數區間 測試樣本 分類模型 技術平衡 決策空間 類別判定 評分標準 輸出結果 數據集中 網格搜索 整體識別 正常區域 采樣數 過采樣 交叉區 空白區 平均法 欠采樣 上下限 分類 準確率 子集 決策 分解 轉化 制定 | ||
1.一種基于自適應平衡集成與動態分層決策的多分類方法,其特征在于,所述方法步驟包括:
(1)根據一對多分解策略將原始數據集轉化為多個二類數據集,以每個二類數據集中多數類樣本與少數類樣本數目分別作為參數區間上下限,平均每類準確率為評分標準,通過網格搜索法獲得各子集采樣數;
(2)據此綜合過采樣與欠采樣技術平衡二類數據集以建立多個二分類子模型,通過平均法集成子模型獲得二分類模型;
(3)根據所有二分類模型輸出結果獲取測試樣本在一對多框架下決策空間位置信息,據此分別制定針對空白區、交叉區、正常區域的類別判定策略以確定樣本最終類別。
2.根據權利要求1所述的方法,其特征在于,根據一對多分解策略將原始數據集轉化為多個二類數據集,以每個二類數據集中多數類樣本與少數類樣本數目分別作為參數區間上下限,平均每類準確率為評分標準,通過網格搜索法獲得各子集采樣數,具體說明如下:假定數據集D的類別總數為m,根據一對多分解策略將原始數據集D轉化為m個二類數據集Di,其中,i=1,2,...,m,每個二類數據集中正類對應某一類別,負類對應剩余所有類別;根據網格搜索法分別對每個Di在{count(less),count(more)}內進行采樣數目搜索,其中count(more)為多數類訓練樣本總數、count(less)為少數類訓練樣本總數,具體地將每個Di隨機劃分為五折,每四折作為訓練集Dtr={lesstr,moretr},lesstr為少數類訓練樣本,moretr為多數類訓練樣本,每一折作為測試集,設定間距d,其中,0<d<count(moretr),從參數區間{count(lesstr),count(moretr)}內等間距確定采樣數目num,據此平衡每四折對應的樣本數據以建立多個分類模型,其中,count(moretr)為moretr中樣本總數、count(lesstr)為lesstr中樣本總數,利用剩余一折包含的樣本對這些分類模型進行測試,保留模型對各個類別的分類準確率ACCi,其中,ACCi表示每個分類模型對第i個類別正確分類的樣本數目占該類樣本總數的比例,將各類別分類準確率求和取平均值得到平均每類準確率MAva:
然后,以MAva作為評分標準,重復實驗多次,將評分值按從大到小順序排列,挑選出評分值前3名對應采樣數目numi1、numi2、numi3,根據轉化公式num'=num/count(lesstr)*count(less)得到最終采樣數目num′i1、num′i2、num′i3,其中,num為轉化前采樣數目,num'為轉化后采樣數目,count(lesstr)為五折中的少數類訓練樣本總數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京郵電大學,未經北京郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811599644.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種基于決策樹的瓷磚等級分類方法
- 下一篇:一種錯位書籍查找系統及其查找方法





