[發(fā)明專利]一種基于改進(jìn)PrefixSpan算法的交易數(shù)據(jù)頻繁序列模式挖掘方法在審
| 申請(qǐng)?zhí)枺?/td> | 202110777271.8 | 申請(qǐng)日: | 2021-07-09 |
| 公開(公告)號(hào): | CN113505156A | 公開(公告)日: | 2021-10-15 |
| 發(fā)明(設(shè)計(jì))人: | 何新;王子龍;陳琛 | 申請(qǐng)(專利權(quán))人: | 南京榮新智能科技有限公司 |
| 主分類號(hào): | G06F16/2458 | 分類號(hào): | G06F16/2458;G06F16/242;G06F16/2453;G06F16/215;G06F16/22;G06Q30/02 |
| 代理公司: | 北京科億知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11350 | 代理人: | 李興林 |
| 地址: | 210000 江*** | 國(guó)省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 改進(jìn) prefixspan 算法 交易 數(shù)據(jù) 頻繁 序列 模式 挖掘 方法 | ||
1.一種基于改進(jìn)PrefixSpan算法的交易數(shù)據(jù)頻繁序列模式挖掘方法,其特征在于,包括以下步驟:
S1)對(duì)獲取的商品交易數(shù)據(jù)進(jìn)行預(yù)處理,得到商品交易數(shù)據(jù)集,并存入交易序列數(shù)據(jù)庫D中;
S2)掃描交易序列數(shù)據(jù)庫D,對(duì)每個(gè)長(zhǎng)度為1的單項(xiàng)進(jìn)行計(jì)數(shù),得到每個(gè)單項(xiàng)的序列支持度sup并降序排列,選出前μ項(xiàng)且滿足最小支持度min_sup的單項(xiàng)作為初始前綴;
S3)采取深度優(yōu)先遍歷,對(duì)第一個(gè)初始前綴的位置進(jìn)行計(jì)算,并保存在前綴位置信息表中,生成商品交易投影數(shù)據(jù)庫;再對(duì)其進(jìn)行迭代,直至無法生成新的商品交易投影數(shù)據(jù)庫,保存每個(gè)商品交易投影數(shù)據(jù)庫生成的頻繁序列模式集合;
S4)從第二個(gè)初始前綴開始,重復(fù)步驟S3),直至所有初始前綴均計(jì)算完畢;
其中,所述步驟S4)具體包括:
S401)生成第二個(gè)初始前綴的商品交易投影數(shù)據(jù)庫;如果該商品交易投影數(shù)據(jù)庫為空,則遞歸返回;
S402)掃描商品交易投影數(shù)據(jù)庫,對(duì)單項(xiàng)進(jìn)行計(jì)數(shù);如果所有單項(xiàng)的序列支持度sup都低于最小支持度min_sup,則遞歸返回;
S403)將滿足最小支持度min_sup的各個(gè)單項(xiàng)和當(dāng)前的前綴進(jìn)行合并,得到若干新的前綴,并計(jì)算新前綴的前綴位置;若前綴位置信息表存在與之前前綴位置相等的前綴,則直接返回前綴位置信息表中前綴所產(chǎn)生的頻繁序列模式集合,并返回步驟S3);否則,前綴位置信息表保存新的前綴位置信息,并生成新的商品交易投影數(shù)據(jù),返回步驟S401)。
2.根據(jù)權(quán)利要求1所述的基于改進(jìn)PrefixSpan算法的交易數(shù)據(jù)頻繁序列模式挖掘方法,其特征在于,步驟S1)中所述對(duì)獲取的商品交易數(shù)據(jù)進(jìn)行預(yù)處理包括對(duì)缺失或重復(fù)出現(xiàn)的訂單記錄進(jìn)行補(bǔ)全或刪除,以及對(duì)出現(xiàn)記錄錯(cuò)誤的數(shù)據(jù)進(jìn)行修正。
3.根據(jù)權(quán)利要求1所述的基于改進(jìn)PrefixSpan算法的交易數(shù)據(jù)頻繁序列模式挖掘方法,其特征在于,步驟S2)中所述前μ項(xiàng)為有效項(xiàng)數(shù),指售貨機(jī)銷售的主要商品的種類。
4.根據(jù)權(quán)利要求3所述的基于改進(jìn)PrefixSpan算法的交易數(shù)據(jù)頻繁序列模式挖掘方法,其特征在于,所述有效項(xiàng)數(shù)μ根據(jù)售貨機(jī)的機(jī)械結(jié)構(gòu)和貨柜容量以及貨道數(shù)量來設(shè)定,或由管理者設(shè)定的主要商品種類數(shù)量來設(shè)定,或根據(jù)這兩者的綜合進(jìn)行設(shè)定。
5.根據(jù)權(quán)利要求1所述的基于改進(jìn)PrefixSpan算法的交易數(shù)據(jù)頻繁序列模式挖掘方法,其特征在于,步驟S3)中所述前綴位置信息表通過Hash表保存。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于南京榮新智能科技有限公司,未經(jīng)南京榮新智能科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110777271.8/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 一種電子商務(wù)用戶公共訪問軌跡提取方法和裝置
- 一種時(shí)空軌跡的模式挖掘方法
- 一種基于改進(jìn)Prefixspan算法的雷達(dá)數(shù)據(jù)頻繁模式挖掘方法
- 一種基于序列模式挖掘的多用戶模型移動(dòng)軌跡預(yù)測(cè)方法
- 一種基于Spark云計(jì)算平臺(tái)的并行序列模式挖掘方法
- 一種移動(dòng)目標(biāo)關(guān)聯(lián)共現(xiàn)模式的確定方法
- 一種告警關(guān)聯(lián)規(guī)則的生成方法和裝置
- 一種基于prefixspan算法的車輛頻繁軌跡挖掘方法及系統(tǒng)
- 一種基于機(jī)器學(xué)習(xí)的工控態(tài)勢(shì)感知系統(tǒng)及方法
- 基于改進(jìn)PrefixSpan算法的報(bào)警泛濫序列數(shù)據(jù)模式提取方法





