[發明專利]一種基于遺傳算法和改進興趣度的智慧零售數據挖掘方法在審
| 申請號: | 201710673608.4 | 申請日: | 2017-08-09 |
| 公開(公告)號: | CN107491988A | 公開(公告)日: | 2017-12-19 |
| 發明(設計)人: | 肖亮;石佳文;汪澍;袁霄 | 申請(專利權)人: | 浙江工商大學 |
| 主分類號: | G06Q30/02 | 分類號: | G06Q30/02;G06F17/30;G06N3/12 |
| 代理公司: | 杭州天正專利事務所有限公司33201 | 代理人: | 王兵,黃美娟 |
| 地址: | 310018 浙江*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 遺傳 算法 改進 興趣 智慧 零售 數據 挖掘 方法 | ||
1.一種基于遺傳算法和改進興趣度的智慧零售數據挖掘方法,包括以下步驟:
1)從商店顧客的消費記錄數據庫中讀取購物信息,確定項集:I={I1,I2,I3......In},項集內包含各類商品,n=k是k項集如I={I1,I2,I3......In},表示各類商品的組成的集合;
2)事務數據庫T={t1,t2,t3......tn},其中事務數據庫中的每一項都包含項集I中的一項或者若干項,事務數據庫中包含每一條購物的消費記錄,每一個事務都用一個TID進行表示;
3)定義項集X支持度,用sup(X)表示,sup(X)等于包含X項集的事務數除以事務數據庫中總的事務數,即
其中Count(x)表示包含X項集的事務數;T事務數據庫中總的事務數,即購物記錄數;
4)定義置信度,若顧客購買商品X和購買商品Y同時發生記為C,則關聯規則X→Y的置信度為C的支持度的值除以購買商品X的支持度的值,用conf表示置信度,則
即關聯規則X→Y的置信度是商品X和商品Y同時出現的事務數跟只出現商品X的事務數的比值,體現了購買商品Y對購買商品X的依賴程度,即在購買商品X發生的情況下再購買商品Y的概率;
5)引入興趣度函數來去除不合理的商品關聯,興趣度模型如下:
其中LIFT(A,B)表示提升度,
6)初始化參數:定義種群大小為m,交叉概率Pc,變異概率Pm,迭代終止代數T,最小支持度minsup,最小支持度minconf,最小興趣度mininterest;
7)初始化種群P={Pc1,Pc2,…Pcm},每個個體根據編碼規則生成;
8)計算每個個體的適應度函數,
將Fit(Ri)≥0個體選擇進入下一代,否則淘汰掉;
9)補充種群的個體:統計上一步操作之后被選入下一代的個體數量n,若n<m則對上一代適應度函數從高到低進行排序,選中m‐n個;
10)適應度值較高的個體復制到下一代中,直到種群大小變為n=m;
11)初始化交配池,令交配池C=φi;
12)找出群體中相同屬性的個體并把它們歸為一類,定義該類為第i(i=l,2,...,n)類,個體濃度為個體的濃度概率為顯然然后定義個體的選擇概率為Q,Q由適應度概率Qf,和濃度概率Qi決定:Q=αQf+(1-α)Qi,其中是常數;
13)交叉操作:采用自適應方法隨機動態調節交叉概率,使得交叉概率Qc能夠隨適應度自動改變.當種群中個體的適應度趨于一致或者趨于局部最優時,使Qc增加,而當群體適應度比較分散時,使Qc減小,其中交叉概率
式中:Qc1=0.9;0.6≤Qc2<0.9;f’為要交叉的2個個體中較大的適應度值,fmax是最大適應度值;favg是平均適應度值;
14)變異操作,采用自適應方法隨機動態調節變異概率,使得變異概率Qm,能夠隨適應度自動改變,當種群中個體的適應度趨于一致或者趨于局部最優時,使Qm增加,而當群體適應度比較分散時,使Qm減小,其中變異概率
式中:Qm1=0.1;0.001≤Qm2<0.1;f為要變異個體的適應度值;
15)判斷終止條件,看是否滿足終止條件,若滿足則終止并輸出關聯規則,判斷生成規則是否滿足置信度:
其中興趣度模型interest(Ri)為:
否則轉到第3)步;
16)輸出滿足最小支持度minsup,最小置信度minconf和最小興趣度的關聯規則。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江工商大學,未經浙江工商大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710673608.4/1.html,轉載請聲明來源鉆瓜專利網。





