[發(fā)明專利]一種動態(tài)數(shù)據(jù)環(huán)境下的數(shù)據(jù)流概念漂移可視化方法有效
| 申請?zhí)枺?/td> | 201310052088.7 | 申請日: | 2013-02-18 |
| 公開(公告)號: | CN103150470A | 公開(公告)日: | 2013-06-12 |
| 發(fā)明(設(shè)計)人: | 馮林;姚遠;陳灃 | 申請(專利權(quán))人: | 大連理工大學 |
| 主分類號: | G06F19/00 | 分類號: | G06F19/00 |
| 代理公司: | 大連星海專利事務(wù)所 21208 | 代理人: | 徐淑東 |
| 地址: | 116024 遼*** | 國省代碼: | 遼寧;21 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 動態(tài) 數(shù)據(jù) 環(huán)境 數(shù)據(jù)流 概念 漂移 可視化 方法 | ||
1.一種動態(tài)數(shù)據(jù)環(huán)境下的數(shù)據(jù)流概念漂移可視化方法,具體包括以下步驟:
步驟1:動態(tài)數(shù)據(jù)流收集模塊(102)從海量實時數(shù)據(jù)流(101)中按照時間順序收集數(shù)據(jù);
步驟2:數(shù)據(jù)流劃分模塊(103)讀取步驟1中的數(shù)據(jù)流數(shù)據(jù),并根據(jù)數(shù)據(jù)流中數(shù)據(jù)到達的先后順序?qū)?shù)據(jù)流進行劃分;所述數(shù)據(jù)流劃分模塊(103)劃分得到的數(shù)據(jù)塊中,包含N條記錄;N是固定變量,由使用者提前設(shè)定;
步驟3:將使用數(shù)據(jù)流劃分模塊(103)劃分后得到靜態(tài)數(shù)據(jù)塊,輸入到kdq樹模塊(104)中構(gòu)建kdq樹;其中,所述kdq樹對應(yīng)的閾值使用基于KL散度的自助法計算給出或由使用者直接給定;
步驟4:將kdq樹模塊(104)所建立的kdq樹、kdq樹對應(yīng)的閾值放入概念池(106)中保存;
步驟5:概念檢測模塊(105)在數(shù)據(jù)流劃分模塊(103)得到一個新的數(shù)據(jù)塊,并檢測新數(shù)據(jù)塊是否是新的概念,概念檢測模塊(105)的檢測結(jié)果根據(jù)由原始數(shù)據(jù)塊、新數(shù)據(jù)塊的KL散度值與概念池(106)中保存的kdq樹對應(yīng)閾值的比較結(jié)果給出;在計算KL散度時需要對原始數(shù)據(jù)塊進行離散化,離散化的結(jié)果由數(shù)據(jù)塊通過kdq樹的結(jié)果給出;
步驟6:當數(shù)據(jù)流劃分模塊(103)獲取新的數(shù)據(jù)塊時,將此數(shù)據(jù)塊與概念池(106)中所保存的概念進行比較,如果找到相似的概念,則對概念統(tǒng)計模塊(107)進行更新;否則將此數(shù)據(jù)塊作為新的概念加入概念池(106)中;
步驟7:重復步驟1-6直至數(shù)據(jù)流結(jié)束;此時將概念統(tǒng)計模塊(107)中的統(tǒng)計信息進行匯總,計算出概念池(106)中每個概念的統(tǒng)計信息;
步驟8:將上述統(tǒng)計信息輸入到概念轉(zhuǎn)移圖模塊(108),利用貝葉斯公式構(gòu)建概念轉(zhuǎn)移圖,完成概念漂移可視化過程。
2.根據(jù)權(quán)利要求1所述的一種動態(tài)數(shù)據(jù)環(huán)境下的數(shù)據(jù)流分類方法,其特征在于,所述步驟3中建立kdq樹包括以下子步驟:
步驟3.1:首先選定數(shù)據(jù)塊中第一個屬性作為當前屬性,在當前維度中尋找中位數(shù)值v,對數(shù)據(jù)塊進行劃分,使得劃分后得到的兩個子集中的樣本數(shù)量基本相等,即當前屬性的數(shù)值大于v的數(shù)據(jù)以及當前屬性的數(shù)值小于或等于v的數(shù)據(jù)的數(shù)量基本相等;
步驟3.2:在上述所得到的子集中,在后繼屬性中尋找能夠滿足劃分條件的屬性,并選擇此屬性作為當前屬性,重復尋找中位數(shù)值的過程,繼續(xù)劃分數(shù)據(jù)子集;
步驟3.3:重復以上過程,直到滿足終止條件為止;
所述劃分條件為:當前維度數(shù)據(jù)的最大值與小值之差大于變量ε,且ε值由用戶指定;
所述終止條件為:當前數(shù)據(jù)塊的數(shù)據(jù)規(guī)模小于nmin,或者每一維度的最大最小值之差均小于ε,其中于nmin值由用戶提前指定。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于大連理工大學,未經(jīng)大連理工大學許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310052088.7/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種輕薄型LED背光模組
- 下一篇:奧硝唑口服制劑及其制備方法
- 同類專利
- 專利分類
G06F 電數(shù)字數(shù)據(jù)處理
G06F19-00 專門適用于特定應(yīng)用的數(shù)字計算或數(shù)據(jù)處理的設(shè)備或方法
G06F19-10 .生物信息學,即計算分子生物學中的遺傳或蛋白質(zhì)相關(guān)的數(shù)據(jù)處理方法或系統(tǒng)
G06F19-12 ..用于系統(tǒng)生物學的建模或仿真,例如:概率模型或動態(tài)模型,遺傳基因管理網(wǎng)絡(luò),蛋白質(zhì)交互作用網(wǎng)絡(luò)或新陳代謝作用網(wǎng)絡(luò)
G06F19-14 ..用于發(fā)展或進化的,例如:進化的保存區(qū)域決定或進化樹結(jié)構(gòu)
G06F19-16 ..用于分子結(jié)構(gòu)的,例如:結(jié)構(gòu)排序,結(jié)構(gòu)或功能關(guān)系,蛋白質(zhì)折疊,結(jié)構(gòu)域拓撲,用結(jié)構(gòu)數(shù)據(jù)的藥靶,涉及二維或三維結(jié)構(gòu)的
G06F19-18 ..用于功能性基因組學或蛋白質(zhì)組學的,例如:基因型–表型關(guān)聯(lián),不均衡連接,種群遺傳學,結(jié)合位置鑒定,變異發(fā)生,基因型或染色體組的注釋,蛋白質(zhì)相互作用或蛋白質(zhì)核酸的相互作用
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 環(huán)境服務(wù)系統(tǒng)以及環(huán)境服務(wù)事業(yè)
- 環(huán)境控制裝置、環(huán)境控制方法、環(huán)境控制程序及環(huán)境控制系統(tǒng)
- 環(huán)境檢測終端和環(huán)境檢測系統(tǒng)
- 環(huán)境調(diào)整系統(tǒng)、環(huán)境調(diào)整方法及環(huán)境調(diào)整程序
- 環(huán)境估計裝置和環(huán)境估計方法
- 用于環(huán)境艙的環(huán)境控制系統(tǒng)及環(huán)境艙
- 車輛環(huán)境的環(huán)境數(shù)據(jù)處理
- 環(huán)境取樣動力頭、環(huán)境取樣方法
- 環(huán)境艙環(huán)境控制系統(tǒng)
- 環(huán)境檢測儀(環(huán)境貓)
- 編碼裝置,編碼方法,程序和記錄媒體
- 網(wǎng)絡(luò)數(shù)據(jù)流識別系統(tǒng)及方法
- 一種數(shù)據(jù)流調(diào)度的方法、設(shè)備和系統(tǒng)
- 一種確定待清洗數(shù)據(jù)流的方法及裝置
- 用于分析儀器化軟件的數(shù)據(jù)流處理語言
- 用于數(shù)據(jù)流系統(tǒng)的數(shù)據(jù)流處理方法及裝置
- 數(shù)據(jù)流調(diào)度系統(tǒng)以及數(shù)據(jù)流調(diào)度方法
- 采用向量處理的同時分割
- 汽車數(shù)據(jù)流的監(jiān)控方法、系統(tǒng)及可讀存儲介質(zhì)
- 一種數(shù)據(jù)流類型識別模型更新方法及相關(guān)設(shè)備





