[發明專利]一種融合粗糙集與粒計算的分布異構海量城市安全數據流的在線數據挖掘方法在審
| 申請號: | 201310703765.7 | 申請日: | 2013-12-19 |
| 公開(公告)號: | CN103699622A | 公開(公告)日: | 2014-04-02 |
| 發明(設計)人: | 陳庭貴;周廣瀾;許翀寰 | 申請(專利權)人: | 浙江工商大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 杭州斯可睿專利事務所有限公司 33241 | 代理人: | 王利強 |
| 地址: | 310018 浙江*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 融合 粗糙 計算 分布 海量 城市 安全 數據流 在線 數據 挖掘 方法 | ||
技術領域
本發明涉及一種數據挖掘技術領域知識,尤其是一種分布異構海量城市安全數據流的在線數據挖掘方法。
背景技術
城市公共安全狀況,是一個國家競爭力和國家形象的重要標志。隨著城市聚集人口和積累財富的不斷增長,城市的重要性日趨明顯,然而也使其面臨越來越多的安全挑戰。自然災害頻度和強度的增大、各類社會事故的增長以及恐怖主義的威脅,對城市預防災害及應付突發事件的能力提出了更為嚴峻的要求。統計表明,我國每年因城市公共安全問題造成的經濟損失達6500億元,約占GDP總量的6%。國務院新聞辦公室2009年5月11日發表的《中國的減災行動》白皮書指出,我國70%以上的城市、50%以上的人口分布在氣象、地震、地質、海洋等自然災害嚴重的地區??v觀社會發展,俄羅斯切爾諾貝利核泄露、亞洲金融風暴、日本東京地鐵毒氣案、2001年美國“9.11”事件、2003年SARS災害、2009年“H1N1”甲型流感病毒疫情、2010年上?!?1.15”特別重大火災事故等歷史教訓時刻提醒著人們,深入開展有關城市公共安全的研究已是迫在眉睫。
城市公共安全管理過程中,存在著許多潛在的、不為人知的又有用的信息,挖掘出這些信息,對提高城市安全管理有著極其重大的作用。然而由于與城市安全相關的數據通常具有數據量大、變化快、隨機存取代價高、詳細數據難以存儲等特點,因此如何準確、及時的對其進行挖掘,發現具有較高價值的信息是目前研究的難點與熱點。
發明內容
為了克服已有城市公共安全數據的無法進行準確、及時挖掘、數據的有效性較差的不足,本發明提供了一種挖掘的準確性高、及時性較好、數據有效性良好的融合粗糙集與粒計算的分布異構海量城市安全數據流的在線數據挖掘方法。
本發明解決其技術問題所采用的技術方案是:
一種融合粗糙集與粒計算的分布異構海量城市安全數據流的在線數據挖掘方法,所述在線數據挖掘方法包括以下步驟:
1)分布異步海量數據流概念形式化描述:通過數據流的?;?,對概念進行粒的表示、特征化、描述和解釋;基于粒計算的概念分析過程包括以下步驟:①概念分層,采用粒計算模型中的概念格、粒度劃分;②建立概念之間關系;③描述概念的外延和內涵,對屬性和對象進行描述,表明概念之間的泛化關系;④通過對概念的外延偶合度、內涵偶合度和概念偶合度的分析,挖掘數據流隱藏的特征;
2)概念的偶合分析:概念包括內涵和外延,用二元組<Oa;Da>表示,其中,Oa是DS的外延,Da是DS的內涵;假設一個時間段<τb;τe>中的概念為<Oa;Da>,時間來到<τb;τe>,概念變化為<Oa;Da>;<τb;τe>時間段內概念集合所構成的概念格設為CL1,其后續時間段<τb;τe>內的概念集合構成的概念格設為CL2;
3)建立基于屬性約簡的粗糙集海量數據分割方法:在考察當前的條件屬性組合A時,分兩部分來考慮:①所有的相容條件分類X(X∈posA(D))且X∈U/ind(A),相容條件分類X中的所有樣本在A上都含有相同的屬性值以及相同的決策值,在屬性組合A下這些樣本是完全相同的,因此這些樣本可以隨意被分割到不同的子數據集中,也不會造成正域的變化;②所有的沖突條件分類Y(Y∈negA(D))且Y∈U/ind(A);Y中的樣本在A上都含有相同的屬性值以及不同的決策值,在分割父數據集的過程中把同一個沖突條件分類Y的樣本分到同一個子數據集中;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江工商大學,未經浙江工商大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310703765.7/2.html,轉載請聲明來源鉆瓜專利網。





