[發(fā)明專利]一種融合粗糙集與粒計算的分布異構(gòu)海量城市安全數(shù)據(jù)流的在線數(shù)據(jù)挖掘方法在審
| 申請?zhí)枺?/td> | 201310703765.7 | 申請日: | 2013-12-19 |
| 公開(公告)號: | CN103699622A | 公開(公告)日: | 2014-04-02 |
| 發(fā)明(設(shè)計)人: | 陳庭貴;周廣瀾;許翀寰 | 申請(專利權(quán))人: | 浙江工商大學(xué) |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 杭州斯可睿專利事務(wù)所有限公司 33241 | 代理人: | 王利強 |
| 地址: | 310018 浙江*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 融合 粗糙 計算 分布 海量 城市 安全 數(shù)據(jù)流 在線 數(shù)據(jù) 挖掘 方法 | ||
1.一種融合粗糙集與粒計算的分布異構(gòu)海量城市安全數(shù)據(jù)流的在線數(shù)據(jù)挖掘方法,其特征在于:所述在線數(shù)據(jù)挖掘方法包括以下步驟:
1)分布異步海量數(shù)據(jù)流概念形式化描述:通過數(shù)據(jù)流的?;?,對概念進行粒的表示、特征化、描述和解釋;基于粒計算的概念分析過程包括以下步驟:①概念分層,采用粒計算模型中的概念格、粒度劃分;②建立概念之間關(guān)系;③描述概念的外延和內(nèi)涵,對屬性和對象進行描述,表明概念之間的泛化關(guān)系;④通過對概念的外延偶合度、內(nèi)涵偶合度和概念偶合度的分析,挖掘數(shù)據(jù)流隱藏的特征;
2)概念的偶合分析:概念包括內(nèi)涵和外延,用二元組<Oa;Da>表示,其中,Oa是DS的外延,Da是DS的內(nèi)涵;假設(shè)一個時間段<τb;τe>中的概念為<Oa;Da>,時間來到<τb;τe>,概念變化為<Oa;Da>;<τb;τe>時間段內(nèi)概念集合所構(gòu)成的概念格設(shè)為CL1,其后續(xù)時間段<τb;τe>內(nèi)的概念集合構(gòu)成的概念格設(shè)為CL2;
3)建立基于屬性約簡的粗糙集海量數(shù)據(jù)分割方法:在考察當(dāng)前的條件屬性組合A時,分兩部分來考慮:①所有的相容條件分類X(X∈posA(D))且X∈U/ind(A),相容條件分類X中的所有樣本在A上都含有相同的屬性值以及相同的決策值,在屬性組合A下這些樣本是完全相同的,因此這些樣本可以隨意被分割到不同的子數(shù)據(jù)集中,也不會造成正域的變化;②所有的沖突條件分類Y(Y∈negA(D))且Y∈U/ind(A);Y中的樣本在A上都含有相同的屬性值以及不同的決策值,在分割父數(shù)據(jù)集的過程中把同一個沖突條件分類Y的樣本分到同一個子數(shù)據(jù)集中;
4)基于概念格的節(jié)點對的關(guān)聯(lián)規(guī)則挖掘:采用基于先輩晚輩節(jié)點對的關(guān)聯(lián)規(guī)則提取方法來提取概念格上的關(guān)聯(lián)規(guī)則,關(guān)聯(lián)規(guī)則基于頻繁項集挖掘,它的兩個重要的興趣度度量指標(biāo)是支持度和置信度,支持度表明規(guī)則的可用性,而置信度則表明規(guī)則的確定性,對于概念格中的先輩晚輩節(jié)點對(C1,C2),假定C1=(O1∪O,A),C2=(O,A∪B),則在具有A屬性的|O1∪O|個對象中有|O|個也具有B屬性,即可得到關(guān)聯(lián)規(guī)則其支持度是
在概念格上提取規(guī)則:提取外延對象數(shù)大于等于支持度閾值,且晚輩外延對象個數(shù)與先輩外延對象個數(shù)的比值大于等于置信度閾值的節(jié)點對;
5)可伸縮粒計算知識的獲取:通過對信息表分層?;P偷姆治?,采用一種粒分布鏈表方法;
6)建立面向分布異構(gòu)海量的城市安全數(shù)據(jù)流挖掘系統(tǒng)架構(gòu):采用四種輔助網(wǎng)格服務(wù)來支持網(wǎng)格數(shù)據(jù)挖掘:數(shù)據(jù)傳輸服務(wù)、針對數(shù)據(jù)挖掘任務(wù)的資源分配和調(diào)度服務(wù)、數(shù)據(jù)分割服務(wù)以及全局模型生成服務(wù);
其中,數(shù)據(jù)傳輸服務(wù):待挖掘處理數(shù)據(jù)在各網(wǎng)格節(jié)點之間的傳輸以及數(shù)據(jù)挖掘過程中需要處理的信息的過程;
資源分配和調(diào)度服務(wù):能夠最優(yōu)化地把數(shù)據(jù)挖掘的相關(guān)任務(wù)分配到網(wǎng)格資源上進行處理;
數(shù)據(jù)分割服務(wù):作為網(wǎng)格下海量數(shù)據(jù)挖掘的預(yù)處理過程,為了支持網(wǎng)格平臺對海量數(shù)據(jù)的分布式并行挖掘處理;
全局模型生成服務(wù):為了合成各個網(wǎng)格節(jié)點通過函數(shù)挖掘得到的局部模型。
2.如權(quán)利要求1所述的融合粗糙集與粒計算的分布異構(gòu)海量城市安全數(shù)據(jù)流的在線數(shù)據(jù)挖掘方法,其特征在于:所述步驟5)中,結(jié)合數(shù)據(jù)庫技術(shù)為分層粒化模型中的粒子生成粒分布鏈表,引入樣本覆蓋因子。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于浙江工商大學(xué),未經(jīng)浙江工商大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310703765.7/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





