[發明專利]一種融合氣候分區思想的海陸氣候事件關聯規則挖掘方法在審
| 申請號: | 201410176895.4 | 申請日: | 2014-04-29 |
| 公開(公告)號: | CN103942325A | 公開(公告)日: | 2014-07-23 |
| 發明(設計)人: | 鄧敏;石巖;楊文濤;劉啟亮;劉慧敏;何占軍 | 申請(專利權)人: | 中南大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京科億知識產權代理事務所(普通合伙) 11350 | 代理人: | 湯東鳳 |
| 地址: | 410083*** | 國省代碼: | 湖南;43 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 融合 氣候 分區 思想 海陸 事件 關聯 規則 挖掘 方法 | ||
1.一種融合氣候分區思想的海陸氣候事件關聯規則挖掘方法,其特征是,其步驟如下:
(1)時間序列數據正態化檢測與預處理
針對離散分布的空間數據以及每個空間實體所蘊含的時間序列,首先采用QQ圖檢驗法進行時間序列數據正態化檢測,若序列不服從正態分布則對其進行開根號處理,即:
Zi表示原始時間序列數據,Zi’表示原始時間序列數據各個時間點所記數值進行開根號處理后形成的新時間序列;進而采用新的時間序列數據作為下一步分析對象;
(2)采用顧及空間鄰近的層次聚類方法進行陸地氣候分區
2.1)對初始散點數據構造Delaunay三角網,進而對三角網施加整體邊長約束和局部邊長約束,從而精化每個點的空間鄰近域;其中,整體約束條件表達為CGlobal(Ei),表示邊Ei的整體約束條件,利用下列公式進行計算:
其中,Mean(DT)表示三角網的平均邊長;SD(DT)表示三角網所有邊的邊長標準差;|Ei|表示邊Ei的邊長值;
局部邊長約束條件表達為表示與實體p連接的邊Ej的局部約束條件,利用下列公式計算:
其中,Mean(NN(p))表示圖Gi中,p的空間鄰域內所有邊的邊長平均值;SD(pj)為圖Gi中,pj的一階鄰域(即與p直接連接的邊)內所有邊的邊長標準差;Mean(SDi)表示圖Gi中,所有實體的一階鄰域內邊長標準差的平均值;
2.2)針對每個空間實體Em,用WARD法度量與其空間鄰域實體En之間的距離利用下列公式計算:
其中,分別表示空間實體Em和En所含子實體數目(初始狀態下所有實體僅含一個子實體);分別表示空間實體Em和En內所有子實體的屬性均值;
2.3)對數據集中最相似的兩個實體進行聚合成簇,用簇內所有實體屬性均值作為簇的屬性;
2.4)用聚合成的簇作為新實體,重復步驟2.2)和2.3),直到所有點聚合為一個整體,從而得到層次樹和每一層的聚合結果;
2.5)從層次樹中選擇合適的區間結果進行偽T統計量分析,并從中選取合適的聚合結果;其中,空間簇Em、En的離差平方和分別為:
將Em、En聚類El后的離差平方和為:
那么合并后的離差平方和增量為:
進而定義偽T統計量PST為:
其中,分別表示空間實體Em和En所含空間實體數目;xm、xn和xl分別表示空間簇Em、En和El內的空間實體;分別表示空間簇Em、En和El內空間實體的屬性均值;PST越大,說明合并Em、En為El后,離差平方和的增量Wmn與原空間簇Em、En的類內離差平方和的比值越大,即表明合并后的兩個空間簇Em、En越分開,也就是上一層次聚類效果較好;
(3)針對步驟(1)得到的有效陸地氣候區域,融合海洋氣候指數進行顧及多約束的時序關聯規則挖掘
3.1)受約于相關應用背景需要和領域知識,對氣候時間序列進行離散化并從中提取感興趣事件;例如對于降水時間序列,僅提取出其中的異常強、弱降水值所在時間點作為下一步研究對象,并確定因子屬性和結果屬性作為規則前件和后件,例如將海洋氣候要素作為規則前件,陸地氣候要素作為規則后件;
3.2)參數初始化:根據相關領域先驗知識設置時間窗口寬度閾值min_win,時間延遲閾值time_lag,充分度閾值min_Suf,必要度閾值min_Nec;
3.3)針對步驟3.1)提取的感興趣事件,探索性的對其施加時間窗口寬度約束,從而得到一系列的有效前、后件事件集;給定事件序列ES=<s,Ts,Te>,其中:s=<(A1,t1),(A2,t2),…,(An,tn)>表示事件集合,Ai隸屬于不同事件類型ET,Ts和Te分別為ES的起始時間和結束時間;任意n個不同事件類型構成一個n元事件集EP=<ET1,ET2,…,ETn>,其中分別隸屬于這n個事件類型的n個事件構成此事件集的項EPI;若事件集EPI中事件發生時間與結束時間之差,即時間窗口寬度win_width≤min_win,那么EPI即為EP的有效事件;分別針對3.1)中得到的前件和后件,提取得到有效前后件事件集;
3.4)記步驟3.3)得到的有效后件事件集的數目nc,顧及nc、min_Suf和min_Nec,對有效前件事件集進行篩選,保留數目位于區間[nc*min_Nec,nc/min_Suf]的有效前件事件集,以減少無效規則的產生;
3.5)針對兩個前后件事件集EPA和EPC中的有效事件項EPIA和EPIC,可得到形如EPIA→EPIC的關聯規則AR,給定某一有效前件EPIAi和有效后件EPICi,其中時間發生起始時間分別為ts和ts′,結束時間分別記為te和te’,若0<ts′-ts≤time_lag且te’-te>0,那么將EPIAi→EPICi定義為關聯規則AR的一條有效項;進而,記AR的有效項中前件數目為na,后件數目為nc,若na/nc>min_Suf且nc/na>min_Nec,那么定義AR為一條有效關聯規則;從而,采用以上策略提取所有的有效關聯規則;
3.6)根據相關領域知識對得到的有效規則進行驗證分析,最終從規則里面提取出潛在的模式和知識;
(4)對有效規則進行可視化顯示,并輸出最終結果文件。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中南大學,未經中南大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410176895.4/1.html,轉載請聲明來源鉆瓜專利網。





