[發明專利]雷電數據的雷暴聚類方法、裝置、計算機設備和存儲介質在審
| 申請號: | 201910324057.X | 申請日: | 2019-04-22 |
| 公開(公告)號: | CN110334725A | 公開(公告)日: | 2019-10-15 |
| 發明(設計)人: | 田浩;崔風情;谷山強;陳家宏;方玉河;馮萬興;王海濤;趙淳;李健;高攀;林卿;劉靜;嚴波;鄭世玲;操松元;夏令志;陶漢濤 | 申請(專利權)人: | 國家電網有限公司;國網電力科學研究院武漢南瑞有限責任公司;國網安徽省電力有限公司;國網安徽省電力有限公司電力科學研究院 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G01W1/10 |
| 代理公司: | 湖北武漢永嘉專利代理有限公司 42102 | 代理人: | 張惠玲 |
| 地址: | 100031 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 聚類 雷電數據 數據子集 數據量 計算機設備 存儲介質 分區聚類 聚類結果 空間屬性 算法 分區 數據處理能力 初始化處理 常規聚類 大小選擇 分區邊界 結果關系 區域節點 時間尺度 時間屬性 特征參數 寫入文件 時間段 預聚 合并 轉換 | ||
1.一種基于海量雷電數據的雷暴聚類方法,其特征在于,包括以下步驟:
步驟一、對給定的任意時間段任意區域內的所有雷電數據進行初始化處理,設定雷暴聚類的特征參數;
步驟二、結合雷暴聚類的特征參數,對雷電數據集進行時間尺度預聚類,得到所有雷電數據子集;
步驟三、根據雷電數據子集的數據量大小選擇聚類方法,若數據量小使用常規聚類算法,執行步驟七,若數據量大執行步驟四;
步驟四、對每一雷電數據子集進行分區,各分區同步聚類;
步驟五、分區邊界區域節點聚類,找出相鄰分區聚類結果的關聯關系;
步驟六、合并分區聚類結果;
步驟七、聚類結果寫入文件。
2.根據權利要求1所述的基于海量雷電數據的雷暴聚類方法,其特征在于,雷暴聚類的特征參數的設定步驟包括:根據雷電發生的時間順序排序,設定不同雷暴的時間間隔為TSpan,雷暴聚類的鄰域半徑為e,按照TSpan=e的比例將雷電數據的時間屬性轉換為空間屬性,以提高聚類運算的效率。
3.根據權利要求2所述的基于海量雷電數據的雷暴聚類方法,其特征在于,對雷電數據集進行時間尺度預聚類的步驟中,設定雷電數據集為D,當連續兩個雷電的發生時間間隔在TSpan以上時,認為其是不同的數據集;通過對雷電數據集進行時間尺度預聚類,將雷電數據集D劃分為數據集D1,D2,D3…...,Dn。
4.根據權利要求3所述的基于海量雷電數據的雷暴聚類方法,其特征在于,分別統計數據集D1,D2,D3…...,Dn的數據量大小Size1,Size2,Size1Size3…...,Sizen,當Size1,Size2,Size1Size3…...,Sizen的值中存在小于設定的值SizeMin且大于MinPts時,使用常規DBScan算法對對應數據集進行三維聚類。
5.根據權利要求4所述的基于海量雷電數據的雷暴聚類方法,其特征在于,三維聚類是對經度、緯度、時間轉換之后的距離進行聚類。
6.根據權利要求4所述的基于海量雷電數據的雷暴聚類方法,其特征在于,進行數據子集分區,各分區同步聚類的步驟包括:
將數據集D1按照經緯度劃分為若干個網格Grid1、Grid2、Grid3…..,對每個網格進行常規DBScan算法的三維聚類;
取相鄰網格中距離邊界Be距離內的邊界節點組成邊界數據集BD,對BD進行常規DBScan聚類,通過BD聚類結果找出相鄰網格中雷點的關聯關系;
根據相鄰網格中雷點的關聯關系合并相鄰網格中的雷暴,最終得到數據集D1的完整聚類結果;
對數據集D2、D3、D4….進行同樣的處理;
匯總數據集D1、D2、D3、….Dn的完整聚類結果,得到整個數據集D的聚類結果。
7.根據權利要求6所述的基于海量雷電數據的雷暴聚類方法,其特征在于,在將聚類結果寫入文件的步驟中,通過計算機程序統計數據集D中雷電數據的特性,其中,雷電數據的特征至少包括持續時間和范圍,統計完成后進行特性分析,將雷電數據的聚類結果、數據特性及特性分析均寫入文件中。
8.一種基于海量雷電數據的雷暴聚類裝置,其特征在于,包括:
預處理模塊,用于對給定的任意時間段任意區域內的所有雷電數據進行初始化處理,設定雷暴聚類的特征參數;結合雷暴聚類的特征參數,對雷電數據集進行時間尺度預聚類,得到所有雷電數據子集;
執行模塊,用于根據雷電數據子集的數據量大小選擇聚類方法,若數據量小使用常規聚類算法,若數據量大,則每一雷電數據子集進行分區,各分區同步聚類,分區邊界區域節點聚類,找出相鄰分區聚類結果的關聯關系,合并分區聚類結果;
統計模塊,用于統計聚類結果,并將聚類結果寫入文件。
9.一種計算機設備,其特征在于,包括存儲器和處理器,所述存儲器中存儲有計算機可讀指令,所述計算機可讀指令被所述處理器執行時,使得所述處理器執行如權利要求1至7中的任一所述的基于海量雷電數據的雷暴聚類方法中的步驟。
10.一種存儲有計算機可讀指令的存儲介質,其特征在于,所述計算機可讀指令被一個或多個處理器執行時,使得一個或多個處理器執行如權利要求1至7中的任一所述的基于海量雷電數據的雷暴聚類方法的步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國家電網有限公司;國網電力科學研究院武漢南瑞有限責任公司;國網安徽省電力有限公司;國網安徽省電力有限公司電力科學研究院,未經國家電網有限公司;國網電力科學研究院武漢南瑞有限責任公司;國網安徽省電力有限公司;國網安徽省電力有限公司電力科學研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910324057.X/1.html,轉載請聲明來源鉆瓜專利網。





