[發明專利]一種數據關聯規則挖掘算法在審
| 申請號: | 201710649382.4 | 申請日: | 2017-08-01 |
| 公開(公告)號: | CN107463665A | 公開(公告)日: | 2017-12-12 |
| 發明(設計)人: | 龔炎 | 申請(專利權)人: | 廣東云下匯金科技有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 510419 廣東省廣州市開*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 數據 關聯 規則 挖掘 算法 | ||
1.一種數據關聯規則挖掘算法,其特征在于,包括:
第一步,將集合I={i1,i2,...,in}的所有項目按照給定的項最小支持度MIS進行排序;
第二步,掃描數據庫,將數據庫D轉換成垂直數據表示形式,映射到布爾矩陣D1中;新增計數數組m,記錄矩陣中每一列1的個數;
第三步,掃描布爾矩陣D1,根據預設的計算規則生成頻繁1項頻集L1;
第四步,生成新的布爾矩陣D2;根據預設項集計算規則得到加權頻繁2項集L2,更新D2、計數數組m和權重數組w;
第五步,在L2中,根據項集的前綴不同,運用等價類劃分的方式對候選項集進行劃分,在劃分后的子集中,對頻繁項集進行挖掘。將矩陣D2按劃分后的子集,分成不同的子矩陣;
第六步,在劃分后的子矩陣中,根據新的計數數組,刪除冗余矩陣列,更新劃分后的子矩陣,在新的矩陣中,生成新的L3和D3,更新數組m和w;
第七步,當k>2時,處于同一個等價類里的k項集,按照步驟六的方法生成頻繁k+1項集和新的矩陣Dk,直至結束,所述k為生成的布爾矩陣D的數目;
第八步,合并L1、L2和所有等價類中的頻繁項集生成全局加權頻繁項集。
2.如權利要求1所述的一種數據關聯規則挖掘算法,其特征在于,在步驟一之前還包括:
輸入數據庫D和各項目的權值和最小支持度數組MIS。
3.如權利要求1所述的一種數據關聯規則挖掘算法,其特征在于,所述步驟一具體為:
將集合I={i1,i2,...,in},的所有項目按照給定的項最小支持度MIS,由小到大進行排序。
4.如權利要求1所述的一種數據關聯規則挖掘算法,其特征在于,所述步驟二中的布爾矩陣D1具體組成為:
每一個項目都對應矩陣的一行,每一列對應該項目所出現在的事務TID號。
5.如權利要求1所述的一種數據關聯規則挖掘算法,其特征在于,
所述步驟二具體還包括:
通過項目權值計算每條事務的權重,分別將這些事務的權重存儲在一維數組w中,同時計算數據庫總權重W0。
6.如權利要求1所述的一種數據關聯規則挖掘算法,其特征在于,所述步驟三中的所述預設計算規則具體為:
將各行向量與權重向量做內積運算,并比上總權重W0,得到每一項的加權支持度,與最小支持度MIS閾值比較。
7.如權利要求1所述的一種數據關聯規則挖掘算法,其特征在于,所述步驟四中的所述生成新的布爾矩陣具體為:
由所述C1中兩個行向量做相與運算拼接生成C2和新的2項集布爾矩陣D2。
8.如權利要求1所述的一種數據關聯規則挖掘算法,其特征在于,步驟四中的預設項集計算規則具體為:
將行向量與事務權重向量做內積運算,刪除小于最小支持度MIS閾值的2項集得到加權頻繁2項集L2,更新D2、計數數組m和權重數組w。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣東云下匯金科技有限公司,未經廣東云下匯金科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710649382.4/1.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





