[發(fā)明專利]一個基于信息熵的數(shù)據(jù)流自適應集成分類方法在審
| 申請?zhí)枺?/td> | 201611158475.9 | 申請日: | 2016-12-07 |
| 公開(公告)號: | CN108170695A | 公開(公告)日: | 2018-06-15 |
| 發(fā)明(設計)人: | 孫艷歌;卲罕;劉宏兵;馮巖;王淑禮;姚建峰 | 申請(專利權(quán))人: | 信陽師范學院 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 河南省信陽市*** | 國省代碼: | 河南;41 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 漂移 數(shù)據(jù)流 集成分類 分類器 信息熵 自適應 重復 傳感器網(wǎng)絡 分類準確率 抗噪聲能力 數(shù)據(jù)流算法 信用卡欺詐 分類模型 分類效果 模型更新 時間代價 實際問題 實時分類 行為檢測 性能分析 異常檢測 真實數(shù)據(jù) 數(shù)據(jù)集 新概念 檢測 放入 電價 天氣預報 消耗 重建 預測 應用 保證 | ||
1.一個基于信息熵的數(shù)據(jù)流自適應集成分類方法,其特征在于:自適應集成分類方法,分兩個階段組成:概念檢測階段和集成分類階段;其具體步驟包括如下:
步驟一:初始化集成分類器及緩存區(qū);
步驟二:逐個將實例移入到滑動窗口中;
步驟三:利用所提出的基于兩個窗口的檢測模型描述如下:用W1={xt+1,xt+2,...,xt+n}和W2={xt+n+1,...,xt+2n}分別表示t時刻兩個連續(xù)的大小相等的窗口,W1表示參考窗口,W2表示當前窗口。用JSD(W1||W2)度量兩個窗口之間分布的距離,當此值小于等于10-5(非常接近于零)時,表示兩個窗口的數(shù)據(jù)分布相同,即發(fā)現(xiàn)重復概念;當大于10-5小于閾值τ時,認為兩個窗口之間的分布無顯著性差異,當大于閾值則表明此時有概念漂移發(fā)生。閾值采用bootstrap的方法計算得到。由于窗口每次向前滑動一個實例,因此能及時檢測到突變式概念漂移;
步驟四:當檢測到有概念漂移發(fā)生時,就與分類器池中的建立分類器的數(shù)據(jù)的分布進行比較,若是新概念則新建一個分類器加入到分類器池中,并把相應的數(shù)據(jù)放在緩存區(qū);若是重復概念則重用已有分類器。分類器按照重復使用的頻率從高到低排序,當分類器池中存放的分類器數(shù)達到最大值時,則替換最不經(jīng)常使用的分類器;
步驟五:根據(jù)每個基分類器在最新窗口中實例的分類錯誤率,采用加權(quán)投票的方式對每個實例進行預測。
該專利技術資料僅供研究查看技術是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于信陽師范學院,未經(jīng)信陽師范學院許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611158475.9/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 編碼裝置,編碼方法,程序和記錄媒體
- 網(wǎng)絡數(shù)據(jù)流識別系統(tǒng)及方法
- 一種數(shù)據(jù)流調(diào)度的方法、設備和系統(tǒng)
- 一種確定待清洗數(shù)據(jù)流的方法及裝置
- 用于分析儀器化軟件的數(shù)據(jù)流處理語言
- 用于數(shù)據(jù)流系統(tǒng)的數(shù)據(jù)流處理方法及裝置
- 數(shù)據(jù)流調(diào)度系統(tǒng)以及數(shù)據(jù)流調(diào)度方法
- 采用向量處理的同時分割
- 汽車數(shù)據(jù)流的監(jiān)控方法、系統(tǒng)及可讀存儲介質(zhì)
- 一種數(shù)據(jù)流類型識別模型更新方法及相關設備





