[發明專利]可收縮步長的多類別集成學習分類方法在審
| 申請號: | 201510010781.7 | 申請日: | 2015-01-09 |
| 公開(公告)號: | CN104573012A | 公開(公告)日: | 2015-04-29 |
| 發明(設計)人: | 吳悅;嚴超 | 申請(專利權)人: | 上海大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06K9/62;G06K9/66 |
| 代理公司: | 上海上大專利事務所(普通合伙) 31205 | 代理人: | 陸聰明 |
| 地址: | 200444*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 收縮 步長 類別 集成 學習 分類 方法 | ||
1.一種可收縮步長的多類別集成學習分類方法,其特征在于該方法具體步驟如下:
A.??????將原始數據進行預處理,轉換成分類方法可以處理的數據格式,同時獲得訓練數據集和待分類數據集;
B.??????初始化訓練數據集樣本權重;
C.??????從m=1到M迭代,依據訓練數據集樣本權重以及訓練步長,訓練M個基分類器;
D.??????集成步驟C中的所有基分類器,得到最終判別分類器,對待分類數據集進行分類;
E.??????將分類結果保存到文件中,提供分類預測的參考。
2.根據權利要求1所述的可收縮步長的多類別集成學習分類方法,其特征在于所述步驟A的操作步驟如下:
A1.?訓練數據集的預處理:每條數據必須有固定的f個屬性值,在最后還要添加一個類別屬性,表示這條數據的類別已知,總共為f+1個屬性值;
A2.?待分類數據集的預處理:待分類數據集的每條數據形式必須與訓練數據集的前f個屬性形式一致,并且無類別屬性值字段,總共為f個屬性值。
3.根據權利要求1所述的可收縮步長的多類別集成學習分類方法,其特征在于,上述步驟B中初始化訓練數據集樣本權重的操作步驟是:令每個樣本的權重????????????????????????????????????????????????=?1/n?,?i=1,?2,?3…n,其中n為樣本個數。
4.根據權利要求1所述的可收縮步長的多類別集成學習分類方法,其特征在于所述步驟C的操作步驟如下:
C-1.?依據訓練數據集,以權重訓練得到基分類器();
C-2.?計算基分類器()錯誤率:
C-3.?計算基分類器()可信度:
其中變量r為基分類器當前訓練步長
C-4.?從i=1到n,更新訓練數據集樣本權重:
;
C-5.?重新規范化,使其總和為1;
C-6.?計算本次迭代后的判別分類器:
C-7.?判斷是否需要收縮訓練步長,如需,則收縮步長并重新計算步驟C3),C4),C5),C6),保存本次迭代后的最終判別分類器,
C-8若M次迭代結束,則退出迭代,否則跳轉到C1)繼續迭代。
5.根據權利要求4所述的可收縮步長的多類別集成學習分類方法,其特征在于所述步驟C7中判斷是否需要收縮訓練步長的依據是:如果Margin()>Margin()并且Accuracy()<Accuracy(),則收縮步長使得r=()并重新計算步驟C3),C4),C5),C6);否則,不做更改,?最后,保存本次迭代后的最終判別分類器,其中Margin計算訓練模型的空白邊界,Accuracy計算訓練模型的訓練準確率,迭代次數m?→,算法趨于收斂。
6.根據權利要求1所述的可收縮步長的多類別集成學習分類方法,其特征在于所述步驟D的操作步驟如下:
D1.?集成并計算判別分類器,輸出M個基分類器集成后的判別分類器,采用的計算公式為:
其中即為集成學習所輸出的判別分類器,
累加所有基分類器的判別概率,取K類中最大的即為判別結果,
其中包含的權重含有基分類器權重,是經過步長調整后的權重;
D2.?使用步驟D1中計算的判別分類器,為待分類數據集中的所有樣本進行分類。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海大學,未經上海大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510010781.7/1.html,轉載請聲明來源鉆瓜專利網。





