[發明專利]一種數據流概念漂移檢測方法及系統有效
| 申請號: | 201310255816.4 | 申請日: | 2013-06-19 |
| 公開(公告)號: | CN103345575A | 公開(公告)日: | 2013-10-09 |
| 發明(設計)人: | 趙淦森;虞海;王維棟;卓超 | 申請(專利權)人: | 華南師范大學 |
| 主分類號: | G06F19/00 | 分類號: | G06F19/00 |
| 代理公司: | 廣州嘉權專利商標事務所有限公司 44205 | 代理人: | 譚英強 |
| 地址: | 510631 *** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 數據流 概念 漂移 檢測 方法 系統 | ||
1.一種數據流概念漂移檢測方法,其特征在于,包括以下步驟:
A、根據簇集、舊數據集和待檢測數據集,計算舊數據集的簇容忍點集距離平方總和與待檢測數據集的簇容忍點集距離平方總和;
B、根據衰退函數和待檢測數據集,計算簇集中各個簇的簇演變值;
C、通過分析得到對應待檢測數據集的簇不可容忍點集并對其數據點進行劃分形成新簇集,進而計算新簇集中各個簇的新簇接受值;
D、根據計算得到的簇演變值、新簇接受值、舊數據集的簇容忍點集距離平方總和與待檢測數據集的簇容忍點集距離平方總和,計算概念漂移級別值。
2.根據權利要求1所述的一種數據流概念漂移檢測方法,其特征在于:所述的步驟A包括:
A1、根據舊數據集和簇集,計算舊數據集中數據點與簇集中各個簇之間的距離,進而得到數據點的最近簇并將數據點劃分到其對應最近簇中;
A2、通過計算簇集中各個簇的簇容忍距離,得到對應舊數據集的簇集各個簇的簇容忍點集的集合;
A3、根據簇集中各個簇的簇容忍距離和待檢測數據集,得到對應待檢測數據集的簇集各個簇的簇容忍點集的集合;
A4、根據對應待檢測數據集的簇集各個簇的簇容忍點集的集合,計算待檢測數據集的過度分散值;
A5、根據對應舊數據集的簇集各個簇的簇容忍點集,計算各個簇容忍點集中數據點與對應簇的距離平方和,進而對得到的多個距離平方和進行總和計算,得到對應舊數據集的簇容忍點集距離平方總和;
A6、根據對應待檢測數據集的簇集各個簇的簇容忍點集,計算各個簇容忍點集中數據點與對應簇的距離平方和,進而對得到的多個距離平方和進行總和計算,得到對應待檢測數據集的簇容忍點集距離平方總和。
3.根據權利要求2所述的一種數據流概念漂移檢測方法,其特征在于:所述的步驟C包括:
C1、根據簇集中各個簇的簇容忍距離和待檢測數據集,得到對應待檢測數據集的簇集各個簇的簇不可容忍點集的集合;
C2、根據簇集中各個簇的簇容忍距離,對簇不可容忍點集中的數據點通過聚類處理將其劃分至簇集中,形成新簇集;
C3、根據新簇集和簇新增閾值,計算新簇集中各個簇的新簇接受值。
4.根據權利要求3所述的一種數據流概念漂移檢測方法,其特征在于:所述步驟A4中所述的過度分散值,其計算公式為:
其中,SCTDi為第i個簇容忍點集,t為簇容忍點集的個數,SIZE(SCTDi)為簇容忍點集中的元素個數,n為待檢測數據集的點數量,α為過度閾值因子,DOD為過度分散值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華南師范大學,未經華南師范大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310255816.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種文本加解密方法和加解密設備
- 下一篇:再流焊加載曲線參數的設置方法
- 同類專利
- 專利分類
G06F 電數字數據處理
G06F19-00 專門適用于特定應用的數字計算或數據處理的設備或方法
G06F19-10 .生物信息學,即計算分子生物學中的遺傳或蛋白質相關的數據處理方法或系統
G06F19-12 ..用于系統生物學的建?;蚍抡?,例如:概率模型或動態模型,遺傳基因管理網絡,蛋白質交互作用網絡或新陳代謝作用網絡
G06F19-14 ..用于發展或進化的,例如:進化的保存區域決定或進化樹結構
G06F19-16 ..用于分子結構的,例如:結構排序,結構或功能關系,蛋白質折疊,結構域拓撲,用結構數據的藥靶,涉及二維或三維結構的
G06F19-18 ..用于功能性基因組學或蛋白質組學的,例如:基因型–表型關聯,不均衡連接,種群遺傳學,結合位置鑒定,變異發生,基因型或染色體組的注釋,蛋白質相互作用或蛋白質核酸的相互作用





