[發(fā)明專利]一種動(dòng)態(tài)數(shù)據(jù)環(huán)境下的數(shù)據(jù)流概念漂移可視化方法有效
| 申請(qǐng)?zhí)枺?/td> | 201310052088.7 | 申請(qǐng)日: | 2013-02-18 |
| 公開(公告)號(hào): | CN103150470A | 公開(公告)日: | 2013-06-12 |
| 發(fā)明(設(shè)計(jì))人: | 馮林;姚遠(yuǎn);陳灃 | 申請(qǐng)(專利權(quán))人: | 大連理工大學(xué) |
| 主分類號(hào): | G06F19/00 | 分類號(hào): | G06F19/00 |
| 代理公司: | 大連星海專利事務(wù)所 21208 | 代理人: | 徐淑東 |
| 地址: | 116024 遼*** | 國(guó)省代碼: | 遼寧;21 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 動(dòng)態(tài) 數(shù)據(jù) 環(huán)境 數(shù)據(jù)流 概念 漂移 可視化 方法 | ||
1.一種動(dòng)態(tài)數(shù)據(jù)環(huán)境下的數(shù)據(jù)流概念漂移可視化方法,具體包括以下步驟:
步驟1:動(dòng)態(tài)數(shù)據(jù)流收集模塊(102)從海量實(shí)時(shí)數(shù)據(jù)流(101)中按照時(shí)間順序收集數(shù)據(jù);
步驟2:數(shù)據(jù)流劃分模塊(103)讀取步驟1中的數(shù)據(jù)流數(shù)據(jù),并根據(jù)數(shù)據(jù)流中數(shù)據(jù)到達(dá)的先后順序?qū)?shù)據(jù)流進(jìn)行劃分;所述數(shù)據(jù)流劃分模塊(103)劃分得到的數(shù)據(jù)塊中,包含N條記錄;N是固定變量,由使用者提前設(shè)定;
步驟3:將使用數(shù)據(jù)流劃分模塊(103)劃分后得到靜態(tài)數(shù)據(jù)塊,輸入到kdq樹模塊(104)中構(gòu)建kdq樹;其中,所述kdq樹對(duì)應(yīng)的閾值使用基于KL散度的自助法計(jì)算給出或由使用者直接給定;
步驟4:將kdq樹模塊(104)所建立的kdq樹、kdq樹對(duì)應(yīng)的閾值放入概念池(106)中保存;
步驟5:概念檢測(cè)模塊(105)在數(shù)據(jù)流劃分模塊(103)得到一個(gè)新的數(shù)據(jù)塊,并檢測(cè)新數(shù)據(jù)塊是否是新的概念,概念檢測(cè)模塊(105)的檢測(cè)結(jié)果根據(jù)由原始數(shù)據(jù)塊、新數(shù)據(jù)塊的KL散度值與概念池(106)中保存的kdq樹對(duì)應(yīng)閾值的比較結(jié)果給出;在計(jì)算KL散度時(shí)需要對(duì)原始數(shù)據(jù)塊進(jìn)行離散化,離散化的結(jié)果由數(shù)據(jù)塊通過kdq樹的結(jié)果給出;
步驟6:當(dāng)數(shù)據(jù)流劃分模塊(103)獲取新的數(shù)據(jù)塊時(shí),將此數(shù)據(jù)塊與概念池(106)中所保存的概念進(jìn)行比較,如果找到相似的概念,則對(duì)概念統(tǒng)計(jì)模塊(107)進(jìn)行更新;否則將此數(shù)據(jù)塊作為新的概念加入概念池(106)中;
步驟7:重復(fù)步驟1-6直至數(shù)據(jù)流結(jié)束;此時(shí)將概念統(tǒng)計(jì)模塊(107)中的統(tǒng)計(jì)信息進(jìn)行匯總,計(jì)算出概念池(106)中每個(gè)概念的統(tǒng)計(jì)信息;
步驟8:將上述統(tǒng)計(jì)信息輸入到概念轉(zhuǎn)移圖模塊(108),利用貝葉斯公式構(gòu)建概念轉(zhuǎn)移圖,完成概念漂移可視化過程。
2.根據(jù)權(quán)利要求1所述的一種動(dòng)態(tài)數(shù)據(jù)環(huán)境下的數(shù)據(jù)流分類方法,其特征在于,所述步驟3中建立kdq樹包括以下子步驟:
步驟3.1:首先選定數(shù)據(jù)塊中第一個(gè)屬性作為當(dāng)前屬性,在當(dāng)前維度中尋找中位數(shù)值v,對(duì)數(shù)據(jù)塊進(jìn)行劃分,使得劃分后得到的兩個(gè)子集中的樣本數(shù)量基本相等,即當(dāng)前屬性的數(shù)值大于v的數(shù)據(jù)以及當(dāng)前屬性的數(shù)值小于或等于v的數(shù)據(jù)的數(shù)量基本相等;
步驟3.2:在上述所得到的子集中,在后繼屬性中尋找能夠滿足劃分條件的屬性,并選擇此屬性作為當(dāng)前屬性,重復(fù)尋找中位數(shù)值的過程,繼續(xù)劃分?jǐn)?shù)據(jù)子集;
步驟3.3:重復(fù)以上過程,直到滿足終止條件為止;
所述劃分條件為:當(dāng)前維度數(shù)據(jù)的最大值與小值之差大于變量ε,且ε值由用戶指定;
所述終止條件為:當(dāng)前數(shù)據(jù)塊的數(shù)據(jù)規(guī)模小于nmin,或者每一維度的最大最小值之差均小于ε,其中于nmin值由用戶提前指定。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于大連理工大學(xué),未經(jīng)大連理工大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310052088.7/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種輕薄型LED背光模組
- 下一篇:奧硝唑口服制劑及其制備方法
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F19-00 專門適用于特定應(yīng)用的數(shù)字計(jì)算或數(shù)據(jù)處理的設(shè)備或方法
G06F19-10 .生物信息學(xué),即計(jì)算分子生物學(xué)中的遺傳或蛋白質(zhì)相關(guān)的數(shù)據(jù)處理方法或系統(tǒng)
G06F19-12 ..用于系統(tǒng)生物學(xué)的建?;蚍抡?,例如:概率模型或動(dòng)態(tài)模型,遺傳基因管理網(wǎng)絡(luò),蛋白質(zhì)交互作用網(wǎng)絡(luò)或新陳代謝作用網(wǎng)絡(luò)
G06F19-14 ..用于發(fā)展或進(jìn)化的,例如:進(jìn)化的保存區(qū)域決定或進(jìn)化樹結(jié)構(gòu)
G06F19-16 ..用于分子結(jié)構(gòu)的,例如:結(jié)構(gòu)排序,結(jié)構(gòu)或功能關(guān)系,蛋白質(zhì)折疊,結(jié)構(gòu)域拓?fù)?,用結(jié)構(gòu)數(shù)據(jù)的藥靶,涉及二維或三維結(jié)構(gòu)的
G06F19-18 ..用于功能性基因組學(xué)或蛋白質(zhì)組學(xué)的,例如:基因型–表型關(guān)聯(lián),不均衡連接,種群遺傳學(xué),結(jié)合位置鑒定,變異發(fā)生,基因型或染色體組的注釋,蛋白質(zhì)相互作用或蛋白質(zhì)核酸的相互作用
- 動(dòng)態(tài)矢量譯碼方法和動(dòng)態(tài)矢量譯碼裝置
- 動(dòng)態(tài)口令的顯示方法及動(dòng)態(tài)令牌
- 動(dòng)態(tài)庫(kù)管理方法和裝置
- 動(dòng)態(tài)令牌的身份認(rèn)證方法及裝置
- 令牌、動(dòng)態(tài)口令生成方法、動(dòng)態(tài)口令認(rèn)證方法及系統(tǒng)
- 一種動(dòng)態(tài)模糊控制系統(tǒng)
- 一種基于動(dòng)態(tài)信號(hào)的POS機(jī)和安全保護(hù)方法
- 圖像動(dòng)態(tài)展示的方法、裝置、系統(tǒng)及介質(zhì)
- 一種基于POS機(jī)聚合碼功能分離顯示動(dòng)態(tài)聚合碼的系統(tǒng)
- 基于動(dòng)態(tài)口令的身份認(rèn)證方法、裝置和動(dòng)態(tài)令牌
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 環(huán)境服務(wù)系統(tǒng)以及環(huán)境服務(wù)事業(yè)
- 環(huán)境控制裝置、環(huán)境控制方法、環(huán)境控制程序及環(huán)境控制系統(tǒng)
- 環(huán)境檢測(cè)終端和環(huán)境檢測(cè)系統(tǒng)
- 環(huán)境調(diào)整系統(tǒng)、環(huán)境調(diào)整方法及環(huán)境調(diào)整程序
- 環(huán)境估計(jì)裝置和環(huán)境估計(jì)方法
- 用于環(huán)境艙的環(huán)境控制系統(tǒng)及環(huán)境艙
- 車輛環(huán)境的環(huán)境數(shù)據(jù)處理
- 環(huán)境取樣動(dòng)力頭、環(huán)境取樣方法
- 環(huán)境艙環(huán)境控制系統(tǒng)
- 環(huán)境檢測(cè)儀(環(huán)境貓)
- 編碼裝置,編碼方法,程序和記錄媒體
- 網(wǎng)絡(luò)數(shù)據(jù)流識(shí)別系統(tǒng)及方法
- 一種數(shù)據(jù)流調(diào)度的方法、設(shè)備和系統(tǒng)
- 一種確定待清洗數(shù)據(jù)流的方法及裝置
- 用于分析儀器化軟件的數(shù)據(jù)流處理語(yǔ)言
- 用于數(shù)據(jù)流系統(tǒng)的數(shù)據(jù)流處理方法及裝置
- 數(shù)據(jù)流調(diào)度系統(tǒng)以及數(shù)據(jù)流調(diào)度方法
- 采用向量處理的同時(shí)分割
- 汽車數(shù)據(jù)流的監(jiān)控方法、系統(tǒng)及可讀存儲(chǔ)介質(zhì)
- 一種數(shù)據(jù)流類型識(shí)別模型更新方法及相關(guān)設(shè)備





