[發明專利]一種基于改進Apriori算法的雷電活動數據統計方法無效
| 申請號: | 201310480978.8 | 申請日: | 2013-12-13 |
| 公開(公告)號: | CN103593400A | 公開(公告)日: | 2014-02-19 |
| 發明(設計)人: | 王衛民;李婧;雷欣;田社教;高瑩 | 申請(專利權)人: | 陜西省氣象局 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06F19/00 |
| 代理公司: | 西安億諾專利代理有限公司 61220 | 代理人: | 康凱 |
| 地址: | 710000 陜西省西安*** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 改進 apriori 算法 雷電 活動 數據 統計 方法 | ||
1.一種基于改進Apriori算法的雷電活動數據統計方法,其特征在于,包括以下步驟:
1)、計算加權支持度與加權置信度:為每個項目賦予[0,1]之間一個非負實數作為權值,以體現該項目的重要度,并根據該權值計算各項集的權重,進而推出項集的加權支持度與加權置信度,所述支持度與置信度定義是:項目集合I={?i1,?i2,?…,?im}是由m個不同的項組成,交易數據庫D中每一筆交易都是I的一個子集,關聯規則的形式為X?=>Y,其中X∈I,Y∈I,且X∩Y=,X的支持度sup(XUY)為XUY在交易數據庫中出現的概率,X的信任度conf(?XUY)為在某交易中包含X前提下同對也包含Y的概率.也就是說,關聯規則X?=>Y的支持度為數據庫中包含XUY的交易數與總交易數之比;關聯規則的信任度為數據庫中包含XUY的交易數與包含X的交易數之比;
2)、垂直位矢量格式轉換:將原水平數據格式{事務標志:事務項集}轉化為垂直數據格式{項:事務集},然后掃描數據庫一次,計算出符合加權支持度與加權置信度的頻繁項,并設置它們相應的位矢量;
3)、頻繁二項圖生成:根據頻繁項計算出符合關聯規則的頻繁2項集,以各個滿足頻繁2項集的項目作為節點,繪制出表示各個項目之間關系的有向圖;
4)候選項集挖掘:通過對頻繁2項圖的深度優先遍歷,找到該圖的最長路徑,即為最長頻繁項集,繼而根據任何強項集的子集必定是強項集的性質,找出所有頻繁集。
2.如權利要求1所述基于改進Apriori算法的雷電活動數據統計方法,其特征在,所述步驟2)的具體過程是:如果該事務中存在對應的項免則設置對應項為1,否則設置對應項為0,當檢查完所有事務集合每個項對應一個二進制位串,然后按照支持數從高到低排序將數據庫中的項目映射到位圖。
3.如權利要求1所述基于改進Apriori算法的雷電活動數據統計方法,其特征在,所述步驟3)的具體過程是:將得到的位圖中1出現次數最多的節點放在最上層,若某兩項在一次事務中同時出現,并且出現的次數滿足最小支持度要求,大于或等于最小支持度,則在有向圖中這兩個節點之間畫一條邊,邊上用二進制字符串表示,二進制字符串通過兩個節點求與運算得到,其中串中1的個數表示這兩個節點同時出現的次數。
4.如權利要求1所述基于改進Apriori算法的雷電活動數據統計方法,其特征在,加權支持度與加權置信度的具體計算過程是:
設I={?i1,?i2,?…,?im},對應i的權值向量W={?w1,?w2,?…,?wm?},第?i個事務ti是I的一個子集,ti中第j個項目(記作ti?[ij])都有一個權值w,
這樣每一個項目都與W中的一個值對應起來,項集事務權值是一個數據庫中項目集中各項目的權值匯總,項目集X在事務ti中的項目權值計算為:????????????????????????????????????????????????
加權支持度是事務數據庫中包含該項目的事務項集權值的匯總:
其中NX是X在數據庫中出現的計數;n是總記錄數;
加權置信度是事務數據庫中滿足X∪Y?的加權支持度與包含X的加權支持度的比值?:
。
5.如權利要求2所述基于改進Apriori算法的雷電活動數據統計方法,其特征在,所述步驟2)的具體過程是:于有向圖與加權關聯規則的Apriori算法的優化方法,其特征在,如果該事務中存在對應的項則設置對應項為1,否則設置對應項為0,當檢查完所有事務集合每個項對應一個二進制位串,然后按照支持數從高到低排序將數據庫中的項目節點映射到位圖,設最小支持度計數是2,則在本數據庫中頻繁項是i1,i2,i3,i4,i5;
對應Bi1=(100110111),Bi2=(111101011),Bi3=(0010lllll),Bi4=(010100000),Bi5=(100000010)。
6.如權利要求1所述基于改進Apriori算法的雷電活動數據統計方法,其特征在,所述步驟4)的具體過程是,(1)頻繁2項集做深度優先遍歷,并記錄最長路徑D;
(2)D中路徑長度為l,如果l=0,說明找不到頻繁項集,否則,當l>0時,執行(3);
(3)計算D中每一條路徑的加權支持度,找出所有滿足最小支持度的路徑,若存在,它們就是頻繁項集,算法到此結束;
否則執行(4);
(4)對于D中的每一條路徑,找出所有路徑的長度為l-1的子集,并利用圖1驗證它們是否連通,若為連通路徑,將該路徑記錄在D中,返回(2)。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于陜西省氣象局,未經陜西省氣象局許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310480978.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種分體自吸式文丘里管洗滌器
- 下一篇:一種濕式布袋深度除塵系統





