[發明專利]基于Eclat的多元時間序列關聯規則挖掘方法在審
| 申請號: | 201710763342.2 | 申請日: | 2017-08-30 |
| 公開(公告)號: | CN107562865A | 公開(公告)日: | 2018-01-09 |
| 發明(設計)人: | 張春慨 | 申請(專利權)人: | 哈爾濱工業大學深圳研究生院 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 深圳市科吉華烽知識產權事務所(普通合伙)44248 | 代理人: | 胡吉科 |
| 地址: | 518000 廣東省深*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 eclat 多元 時間 序列 關聯 規則 挖掘 方法 | ||
1.一種基于Eclat的關聯規則挖掘方法,其特征在于:所述方法包括:(1)生成垂直數據集;(2)生成MINHASH矩陣,MINHASH矩陣需要指定參數k,其意義是矩陣最多有k行;(3)利用MINHASH矩陣估計原始數據集中的候選項集;(4)根據最小支持度把候選集剪枝后得到頻繁項集1;(5)在哈希頻繁1項集兩兩合并生成新的頻繁2項集;(6)循環步驟(4)、(5)直到無法合并,結束算法;其中,步驟(3)中使用MinHash估計集合交集大小,對于多個集合S1,S2,…Si,…,Sm,包含最多元素的集合大小為nmax=maxi|Si|,集合交集大小估計值為
其中∩kmin(Si)表示使用MinHash方法抽樣形成的哈希矩陣中集合Si的交集。
2.根據權利要求1所述的方法,其特征在于:所述步驟(1)中,在原始事務集上經過倒排得到垂直數據集。
3.根據權利要求1所述的方法,其特征在于:步驟(2)還包括釋放垂直數據集以節省內存。
4.根據權利要求1所述的方法,其特征在于:所述最小支持度使用MinHash估計。
5.根據權利要求1所述的方法,其特征在于:所述方法應用于多元時間序列的關聯規則挖掘。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于哈爾濱工業大學深圳研究生院,未經哈爾濱工業大學深圳研究生院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710763342.2/1.html,轉載請聲明來源鉆瓜專利網。





