[發明專利]一種時序約束的大數據關聯規則挖掘方法在審
| 申請號: | 202210797772.7 | 申請日: | 2022-07-06 |
| 公開(公告)號: | CN115033622A | 公開(公告)日: | 2022-09-09 |
| 發明(設計)人: | 梁璟;鄒耀增;戴燎元;劉熙;詹蘊學;劉文用;韓聲利;李燦紅;劉宇;戴科;劉利強 | 申請(專利權)人: | 湖南豐匯銀佳科技股份有限公司 |
| 主分類號: | G06F16/2458 | 分類號: | G06F16/2458;G06N5/02;G06Q30/02 |
| 代理公司: | 長沙大珂知識產權代理事務所(普通合伙) 43236 | 代理人: | 王瓊琦 |
| 地址: | 410205 湖南省*** | 國省代碼: | 湖南;43 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 時序 約束 數據 關聯 規則 挖掘 方法 | ||
1.一種時序約束的大數據關聯規則挖掘方法,其特征在于,所述方法包括:
S1:利用時間滑動窗口對待挖掘數據流進行處理,形成數據庫;
S2:掃描數據庫,計算數據庫中每種元素的價值,刪除價值小于預定值的元素,并按價值大小對剩下的元素排序;
S3:再次掃描數據庫,調整數據庫中元素順序,調整后元素的順序為基于價值大小的元素排序順序;
S4:構建初始元素價值列表,通過迭代的方式構建K集合價值列表;
S5:構建集合枚舉樹,利用價值策略方法對集合枚舉樹進行剪枝,最終枚舉出的元素序列集合即為數據庫的關聯規則。
2.如權利要求1所述的一種時序約束的大數據關聯規則挖掘方法,其特征在于,所述S1步驟中利用時間滑動窗口對待挖掘數據流進行滑動處理,形成不同時序約束下的數據庫,包括
設置基于時序約束的時間滑動窗口大小為W,并設置時序約束的初始時刻為t1,將連續的數據流依次輸入到時間滑動窗口中,其中表示時刻ti的事務數據,事務數據包括q種不同元素的事務數據其中表示時刻ti時,元素mq的事務數據項;
時間滑動窗口對數據流D中事務數據的時刻進行判斷,若當前輸入的事務數據項時刻為初始時刻t1,則將該時刻所對應的事務數據存儲到時間滑動窗口中,并依次將后續時刻的事務數據存儲到時間滑動窗口中,直到時間滑動窗口無存儲空間,若數據流中無要輸入的事務數據,則自動修改時間滑動窗口大小為當前窗口內事務數據的數目,得到存滿的時間滑動窗口;若當前輸入的事務數據時刻不為初始時刻t1,則跳過該時刻的事務數據;
將存滿的時間滑動窗口作為時序初始時刻t1,時序范圍為W的數據庫;
通過設置不同的時間滑動窗口大小以及初始時刻,獲取若干不同時序約束下的數據庫,則在不同時序約束條件下挖掘大數據關聯規則。
3.如權利要求2所述的一種時序約束的大數據關聯規則挖掘方法,其特征在于,所述S1步驟中對數據庫中的數據進行歸一化處理,包括:
對數據庫中的事務數據項進行歸一化處理:
其中:
xi表示元素i的事務數據頂;
xi,min表示元素i中事務數據項的最小值;
xi,max表示元素i中事務數據項的最大值;
x′i表示歸一化處理后的事務數據項。
4.如權利要求3所述的一種時序約束的大數據關聯規則挖掘方法,其特征在于,所述S2步驟中計算數據庫中每種元素的的價值,包括:
每種元素i都有外部價值ex(mi),所述外部價值表示該元素對用戶的重要性,在用戶交易數據庫中,不同元素可以是不同類型的商品,元素的外部價值為商品的利潤;
對于數據庫中不同時刻的事務數據事務數據中元素mi的數量即為元素mi在事務數據中的內部價值在用戶交易數據庫中,元素mi在事務數據中的數量表示在時刻ti時不同商品的購買量;
計算數據庫不同元素的價值:
其中:
W表示數據庫中事務數據集合;
刪除元素價值value(mi)<minvalue的元素,并按價值大小對剩下的元素排序,其中minvalue表示預設定的最小價值。
5.如權利要求4所述的一種時序約束的大數據關聯規則挖掘方法,其特征在于,所述S3步驟中調整數據庫中元素順序,調整后元素的順序為基于價值大小的元素排序順序,包括:
再次掃描數據庫,調整數據庫中元素的順序,調整后元素的順序為基于價值大小的元素排序順序,元素價值越大則排序越靠前。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于湖南豐匯銀佳科技股份有限公司,未經湖南豐匯銀佳科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210797772.7/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種隔離器通風用過濾器及過濾系統
- 下一篇:一種消防安全LED應急燈照明系統
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





