[發明專利]基于歷史分類器二次學習的數據流分類方法在審
| 申請號: | 201811599198.4 | 申請日: | 2018-12-26 |
| 公開(公告)號: | CN109447188A | 公開(公告)日: | 2019-03-08 |
| 發明(設計)人: | 劉若辰;張澤桐;焦李成;劉靜;慕彩虹;張向榮 | 申請(專利權)人: | 西安電子科技大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 陜西電子工業專利中心 61205 | 代理人: | 陳宏社;王品華 |
| 地址: | 710071 陜*** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 分類器 數據流分類 待分類數據 歷史信息 存檔 動態數據環境 分類結果 訓練數據 學習 構建分類器 集成分類器 分類數據 用戶輸出 分類 構建 更新 糾正 | ||
1.一種基于歷史分類器二次學習的數據流分類方法,其特征在于,包括如下步驟:
(1)獲取訓練數據和待分類數據:
接收動態數據環境下的數據流,并將數據流中的數據按照接收順序劃分為n個數據塊,n≥3,將每個數據塊中帶有分類標簽的數據作為訓練數據,其余的數據作為待分類數據,記第t個數據塊的訓練數據為Dt,待分類數據為Tt,并將t初始化為1;
(2)獲取分類器ft:
將訓練數據Dt輸入到回歸樹中對其進行訓練,得到分類器ft;
(3)判斷存檔A中存入的分類器數量是否更新要求:
將分類器ft存入存檔A中,并判斷A內存入的分類器的數量是否小于m,2≤m<n,若是,令t=t+1,并執行步驟(2),否則,將t=m時存檔A中的分類器放入存檔St中,并執行步驟(4);
(4)對存檔St中的分類器進行更新:
當t=m時,將訓練數據Dt輸入到回歸樹中對其進行訓練,得到分類器ft,并將分類器ft存入存檔St中,通過多樣性函數求取St內存入的每個分類器相對其他分類器的多樣性值的和divs,然后刪除St內divs值最小的分類器,得到更新后的存檔St;
(5)對訓練數據Dt進行分類:
當t=m時,通過St內的分類器對訓練數據Dt進行分類,得到分類結果Yt;
(6)對歷史分類器進行二次學習,并構建分類器集成EMt:
(6a)當t=m時,計算訓練數據Dt的新分類標簽Yt′:Yt′=Yt-y,并用Yt′替換訓練數據Dt的分類標簽,得到數據集Dt′,然后將Dt′輸入到回歸樹中對其進行訓練,得到分類器Ft′,最后將Ft′與從存檔St中讀取的歷史存入的分類器Ft的和作為分類器組Ft+Ft′,實現對歷史分類器的二次學習;
(6b)當t=m時,按照下式對分類器ft與分類器組Ft+Ft′進行組合,得到分類器集成EMt:
EMt=(Ft+Ft′+ft)/(m+1);
(7)對待分類數據Tt進行分類:
當t=m時,將待分類數據Tt輸入到集成EMt中進行分類,得到待分類數據Tt的分類結果;
(8)獲取t=m+1以后的待分類數據Tt的分類結果:
令t=t+1,重復執行步驟(4)到步驟(7),直到當t>n停止,得到n-m個待分類數據的分類結果;
(9)向用戶輸出所有待分類數據的分類結果。
2.根據權利要求1所述的一種動態數據環境下的數據流分類方法,其特征在于,步驟(2)、步驟(4)和步驟(6a)中所述的回歸樹,采用CART樹或Hoeffding樹。
3.根據權利要求1所述的一種動態數據環境下的數據流分類方法,其特征在于,步驟(4)中所述的多樣性函數,其表達式為:
其中,fi為存檔St中第i個分類器,fj為存檔St中第j個分類器,Q(fi,fj)為分類器距離函數:
其中,N11表示訓練數據中分類器fi和分類器fj同時正確分類的數據的數量,N00表示訓練數據中分類器fi和分類器fj同時錯誤分類的數據的數量,N01表示在訓練數據中,分類器fi分類錯誤,但分類器fj分類正確的數據的數量,N10表示在訓練數據中,分類器fi分類正確,但分類器fj分類錯誤的數據的數量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西安電子科技大學,未經西安電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811599198.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:電機故障診斷方法及系統
- 下一篇:讀點定位自助證件存取設備及讀點定位方法





