[發明專利]一種基于遺傳算法和改進興趣度的智慧零售數據挖掘方法在審
| 申請號: | 201710673608.4 | 申請日: | 2017-08-09 |
| 公開(公告)號: | CN107491988A | 公開(公告)日: | 2017-12-19 |
| 發明(設計)人: | 肖亮;石佳文;汪澍;袁霄 | 申請(專利權)人: | 浙江工商大學 |
| 主分類號: | G06Q30/02 | 分類號: | G06Q30/02;G06F17/30;G06N3/12 |
| 代理公司: | 杭州天正專利事務所有限公司33201 | 代理人: | 王兵,黃美娟 |
| 地址: | 310018 浙江*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 遺傳 算法 改進 興趣 智慧 零售 數據 挖掘 方法 | ||
技術領域
本發明包括遺傳算法、基于大數據對智慧零售客戶潛在需求挖掘等領域的知識,具體涉及一種基于遺傳算法和改進興趣度的智慧零售數據挖掘方法。特別適用于在客戶關系管理(CRM)領域,使用智慧零售數據挖掘技術分析顧客的購買行為,有利于為商業提供決策支持。
技術背景
隨著智慧門店的不斷普及,智慧零售業的發展越來越受到重視,企業決策層不斷在銷售數據中尋求產品與產品、產品與客戶等之間潛在的某種關系,從而找到提高產品銷售量的方法,獲取最大利潤。這需要從海量數據中快速準確地挖掘出有價值的能夠描述數據項之間相互聯系的有關知識,然而對于零售業目前仍沒有一個普遍認為最好的標準來判斷規則的實用性;同時,零售商經常擔憂不知道怎樣使用大數據來優化其業務,這使得數據挖掘不能有效地在零售業的決策過程中發揮作用。一種基于遺傳算法和改進興趣度的關聯規則數據挖掘方法,由于它高效率、高準確率等優越性,在智慧門店潛在客戶挖掘應用中具有很明顯的優勢,從而得到了大量的應用。
基于遺傳算法和改進興趣度的智慧零售數據挖掘方法是指門店利用已有的大量顧客消費數據,先用遺傳算法篩選出滿足支持度要求的頻繁項集,再由這些頻繁項集生成用戶感興趣的關聯規則。由于遺傳算法負責找出頻繁項集,所以需要通過適應度函數fit將出現頻率低的項集刪掉;而興趣度則用來篩選,確保規則有趣,即在通過頻繁項集生成關聯規則的時候不僅要滿足最小置信度的要求還要滿足興趣度的要求,這樣就確保了挖掘出來的規則是用戶感興趣的關聯規則。加入蟻群算法和興趣度模型來對客戶潛在需求進行挖掘,使得到的商品之間的關聯性更加可靠,客戶潛在的購物機會更加明確。
智慧零售數據挖掘的一個最典型例子就是WALMART的購物籃分析:總部位于美國阿肯色州的世界著名商業零售連鎖企業沃爾瑪(Wal Mart)為了能夠準確了解顧客在其門店的購買習慣,沃爾瑪對其顧客的購物行為進行購物籃分析,想知道顧客經常一起購買的商品有哪些。“跟尿布一起購買最多的商品竟是啤酒!”這是數據挖掘技術對歷史數據進行分析的結果,反映數據內在的規律,揭示了一個隱藏在“尿布與啤酒”背后的美國人的一種行為模式:在美國,一些年輕的父親下班后經常要到超市去買嬰兒尿布,而他們中有30%~40%的人同時也為自己買一些啤酒。既然尿布與啤酒一起被購買的機會很多,于是沃爾瑪就在其一個個門店將尿布與啤酒并排擺放在一起,結果是尿布與啤酒的銷售量雙雙增長。
發明內容
本發明要克服現有技術的上述缺點,提出了一種基于遺傳算法和改進興趣度的智慧零售數據挖掘方法。
本發明方法加入蟻群算法和興趣度模型來對客戶潛在需求進行挖掘,使得到的商品之間的關聯性更加可靠,客戶潛在的購物機會更加明確。由于該方法具有高效率、高準確率等優越性,在智慧門店潛在客戶挖掘應用中具有很明顯的優勢,從而有巨大的應用價值。
本發明提出的一種基于遺傳算法和改進興趣度的智慧零售數據挖掘方法,包括以下步驟:
1)從商店顧客的消費記錄數據庫中讀取購物信息,確定項集:I={I1,I2,I3......In},項集內包含各類商品,n=1就是1項集如{可樂},n=2就是2項集如{牛奶,面包},n=k就是k項集如I={I1,I2,I3......In},表示各類商品的組成的集合;
2)事務數據庫T={t1,t2,t3......tn},其中事務數據庫中的每一項都包含項集I中的一項或者若干項,事務數據庫中包含每一條購物的消費記錄,每一個事務都用一個TID進行表示;
3)定義項集X支持度,用sup(X)表示,sup(X)等于包含X項集的事務數除以事務數據庫中總的事務數,即
其中Count(x)表示包含X項集的事務數;T事務數據庫中總的事務數,即購物記錄數;
4)定義置信度,若顧客購買商品X和購買商品Y同時發生記為C,則關聯規則X→Y的置信度為C的支持度的值除以購買商品X的支持度的值,用conf表示置信度,則
即關聯規則X→Y的置信度是商品X和商品Y同時出現的事務數跟只出現商品X的事務數的比值,體現了購買商品Y對購買商品X的依賴程度,即在購買商品X發生的情況下再購買商品Y的概率;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江工商大學,未經浙江工商大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710673608.4/2.html,轉載請聲明來源鉆瓜專利網。





