[發(fā)明專利]一種隨機(jī)型分布式數(shù)據(jù)流頻繁項(xiàng)集挖掘系統(tǒng)及其方法無效
| 申請(qǐng)?zhí)枺?/td> | 201010179445.2 | 申請(qǐng)日: | 2010-05-19 |
| 公開(公告)號(hào): | CN101887450A | 公開(公告)日: | 2010-11-17 |
| 發(fā)明(設(shè)計(jì))人: | 曲朝陽;王敬東;孟凡奇;董如意;李鵬;張亮;程成 | 申請(qǐng)(專利權(quán))人: | 東北電力大學(xué) |
| 主分類號(hào): | G06F17/30 | 分類號(hào): | G06F17/30 |
| 代理公司: | 吉林市達(dá)利專利事務(wù)所 22102 | 代理人: | 陳傳林 |
| 地址: | 132012 吉林省吉林市船*** | 國省代碼: | 吉林;22 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 隨機(jī) 分布式 數(shù)據(jù)流 頻繁 挖掘 系統(tǒng) 及其 方法 | ||
1.一種隨機(jī)型分布式數(shù)據(jù)流頻繁項(xiàng)集挖掘系統(tǒng),其特征是,它包含有:
一數(shù)據(jù)項(xiàng)分割器,用于將事務(wù)中所包含的不同項(xiàng)按項(xiàng)進(jìn)行分割,并將分割的若干數(shù)據(jù)項(xiàng)分別發(fā)送至n個(gè)頻繁項(xiàng)集挖掘器;
n個(gè)頻繁項(xiàng)集挖掘器,根據(jù)基于頻繁項(xiàng)事務(wù)的頻繁項(xiàng)集,對(duì)若干個(gè)數(shù)據(jù)項(xiàng)挖掘頻繁項(xiàng)集;
一頻繁項(xiàng)集存儲(chǔ)器,用于匯總存儲(chǔ)挖掘器挖掘出的頻繁項(xiàng)集;
一頻繁項(xiàng)隨機(jī)混合器,將數(shù)據(jù)項(xiàng)順序隨機(jī)混合后,反饋n+1次至數(shù)據(jù)項(xiàng)分割器。
2.一種隨機(jī)型分布式數(shù)據(jù)流頻繁項(xiàng)集挖掘方法,其特征是,它包括以下步驟:
(1)當(dāng)數(shù)據(jù)流到達(dá)數(shù)據(jù)項(xiàng)分割器時(shí),根據(jù)數(shù)據(jù)流中不同事務(wù)到達(dá)的順序?qū)⑶癗個(gè)事務(wù)組成的一個(gè)基本窗口w,對(duì)窗口中的每個(gè)不同項(xiàng)im用一個(gè)長(zhǎng)度為N+1的一維數(shù)組存儲(chǔ),其中所述一維數(shù)組中的第一項(xiàng)表示頻繁項(xiàng),后N項(xiàng)表示N個(gè)事務(wù)中是否包含此頻繁項(xiàng),包含則取1,否則取0,將生成的m個(gè)數(shù)組分成m/n組,分別發(fā)送至n個(gè)頻繁項(xiàng)集挖掘器;
(2)在頻繁項(xiàng)集挖掘器中通過對(duì)不同的“頻繁項(xiàng)-事務(wù)”進(jìn)行與操作以挖掘頻繁項(xiàng)集,并將挖掘出的頻繁項(xiàng)集匯總至頻繁項(xiàng)集存儲(chǔ)器存儲(chǔ),設(shè)定最小支持度閾值s和用戶允許誤差ε,其中s的取值范圍為(0,1),0<ε<<s,將產(chǎn)生的m個(gè)一維數(shù)組兩兩與運(yùn)算,生成新的長(zhǎng)度為N+1的數(shù)組,其中第一項(xiàng)為頻繁項(xiàng)集,將新生成的數(shù)組的后N項(xiàng)求和,如果超出最小支持度計(jì)數(shù),則生成頻繁項(xiàng)集,其中所述最小支持度計(jì)數(shù)為最小支持度閾值s與事務(wù)數(shù)N的乘積,重復(fù)對(duì)窗口中的每個(gè)不同項(xiàng)im用一個(gè)長(zhǎng)度為N+1的一維數(shù)組存儲(chǔ),并重復(fù)將生成的m個(gè)數(shù)組分成m/n組,分別發(fā)送至n個(gè)頻繁項(xiàng)挖掘器,直到產(chǎn)生的頻繁項(xiàng)集為空為止;
(3)將數(shù)據(jù)項(xiàng)通過頻繁項(xiàng)隨機(jī)混合器反饋n+1次至數(shù)據(jù)項(xiàng)分割器,再進(jìn)行深層次挖掘。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于東北電力大學(xué),未經(jīng)東北電力大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010179445.2/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 隨機(jī)數(shù)生成設(shè)備及控制方法、存儲(chǔ)器存取控制設(shè)備及通信設(shè)備
- 隨機(jī)接入方法、用戶設(shè)備、基站及系統(tǒng)
- 真隨機(jī)數(shù)檢測(cè)裝置及方法
- 隨機(jī)元素生成方法及隨機(jī)元素生成裝置
- 數(shù)據(jù)交互方法、裝置、服務(wù)器和電子設(shè)備
- 一種隨機(jī)數(shù)發(fā)生器的多隨機(jī)源管理方法
- 用于彩票行業(yè)的隨機(jī)數(shù)獲取方法及系統(tǒng)
- 隨機(jī)接入方法、裝置及存儲(chǔ)介質(zhì)
- 偽隨機(jī)方法、系統(tǒng)、移動(dòng)終端及存儲(chǔ)介質(zhì)
- 模型訓(xùn)練方法、裝置和計(jì)算設(shè)備
- 編碼裝置,編碼方法,程序和記錄媒體
- 網(wǎng)絡(luò)數(shù)據(jù)流識(shí)別系統(tǒng)及方法
- 一種數(shù)據(jù)流調(diào)度的方法、設(shè)備和系統(tǒng)
- 一種確定待清洗數(shù)據(jù)流的方法及裝置
- 用于分析儀器化軟件的數(shù)據(jù)流處理語言
- 用于數(shù)據(jù)流系統(tǒng)的數(shù)據(jù)流處理方法及裝置
- 數(shù)據(jù)流調(diào)度系統(tǒng)以及數(shù)據(jù)流調(diào)度方法
- 采用向量處理的同時(shí)分割
- 汽車數(shù)據(jù)流的監(jiān)控方法、系統(tǒng)及可讀存儲(chǔ)介質(zhì)
- 一種數(shù)據(jù)流類型識(shí)別模型更新方法及相關(guān)設(shè)備





