[發明專利]一種基于顧客游逛行為的客群分類方法有效
| 申請號: | 201711473628.3 | 申請日: | 2017-12-29 |
| 公開(公告)號: | CN108230023B | 公開(公告)日: | 2021-12-21 |
| 發明(設計)人: | 周建成;陸藝;李宗昌;徐曉冬 | 申請(專利權)人: | 南京光普信息技術有限公司 |
| 主分類號: | G06Q30/02 | 分類號: | G06Q30/02;G06K9/62;H04W4/021;H04W4/029;H04W4/33 |
| 代理公司: | 鹽城市大豐區豐晟知識產權代理事務所(特殊普通合伙) 32454 | 代理人: | 葛瀟敏 |
| 地址: | 210000 江蘇省南京*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 顧客 游逛 行為 分類 方法 | ||
1.一種基于顧客游逛行為的客群分類方法,其特征在于包括如下步驟:
步驟1,對商場進行區域劃分;
步驟2,利用wifi定位信息得到顧客每次到訪商場在各區域的停留時間數據;
步驟3,對步驟2得到的數據進行有效性判斷,得到顧客在各區域的有效游逛占比;
步驟4,對有效游逛占比進行主成分處理,得到顧客的特征向量;
所述步驟4中,對有效游逛占比進行主成分處理,得到顧客的特征向量的具體內容是:設主成分線性方程是:
在R語言平臺調用包“pscych”,對每位顧客在各區域的有效游逛占比的矩陣X,調用函數fa.parallel(X),得到主成分的個數N;調用該包中的princomp函數,得到主成分與原樣本各區域之間線性關系的系數矩陣;
調用函數fa.parallel(X,fa=pc,n.iter=100),得到最優的主成分的選取個數m,選取前m個主成分,得到線性方程的系數矩陣α:
用顧客在各區域的有效游逛占比矩陣乘以系數矩陣X乘以系數矩陣α,得到每位顧客的主成分所構成的主成分矩陣Z:
每一行即為一位顧客在各主成分的數值;
步驟5,對特征向量進行聚類,對聚類結果進行決策樹模型的訓練與測試,得到分類模型:
步驟6,不同的類別數對應測試結果不一樣,處理測試結果,確定最優類別數,對應的分類模型即可對到訪商場顧客進行分類。
2.如權利要求1所述的一種基于顧客游逛行為的客群分類方法,其特征在于:所述步驟1中,對于長條形商場,將每一層劃分為左中右三個區域。
3.如權利要求1所述的一種基于顧客游逛行為的客群分類方法,其特征在于:所述步驟3中,對步驟2得到的數據進行有效性判斷的具體內容是:去掉各區域內總停留時長小于時間閾值的數據,然后計算出各區域有效停留的門檻時間,將各顧客在每個區域的停留時長與該區域的有效停留門檻時間進行比較,若停留時長大于門檻時間,則判定顧客在該區域的停留為有效游逛。
4.如權利要求3所述的一種基于顧客游逛行為的客群分類方法,其特征在于:所述計算各區域有效停留的門檻時間的方法是:對每個區域r,所有停留時長的序列為t=(t1,t2,…,tn),計算這個序列的中位值,將該中位值作為該區域有效停留的門檻時間。
5.如權利要求1所述的一種基于顧客游逛行為的客群分類方法,其特征在于:所述步驟5中,對特征向量進行聚類的具體內容是:對顧客的特征向量Z調用函數kmeans(Z,centers=k),k為自定義的類別數;把聚類結果匹配到每位顧客在各區域的有效游逛占比矩陣X=x′ij中,形成新的數據結構;計算各類別在每個區域的平均占比,對于平均值小于設定閾值的結果,修正為0。
6.如權利要求5所述的一種基于顧客游逛行為的客群分類方法,其特征在于:所述步驟6的具體內容是:遍歷k,重復步驟5,分別計算每個類別對應的分類模型的準確率,從而確定泛化效果最優的類別數,確認最優分類模型。
7.如權利要求6所述的一種基于顧客游逛行為的客群分類方法,其特征在于:所述計算每個類別對應的分類模型的準確率的方法是:用分類模型classify_model對測試集的數據test_data進行分類,在R語言平臺調用predict函數,predict(classify_model,train_data),返回結果為測試集的顧客類別的分類結果classify_result;對比classify_result與test_result,統計加和結果一致的數量A,除以測試集train_data所有顧客數B,得到模型的準確率F=A/B。
8.如權利要求1所述的一種基于顧客游逛行為的客群分類方法,其特征在于:所述步驟5中,對聚類結果進行決策樹模型的訓練與測試,得到分類模型的具體內容是:對每位顧客在各區域的有效游逛占比矩陣X=x′ij和與之匹配的聚類結果result進行分類訓練,對矩陣X隨機抽取50%的數據做訓練集train_data,與之對應的result為train_result,剩下的50%的數據做測試集test_data,與之對應的result為test_result,測試時去掉result列;在R語言平臺調用包“C50”,調用該包中的C5.0函數,classify_model=C5.0(train_data,train_result,trials=10),即得到分類模型classify_model。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京光普信息技術有限公司,未經南京光普信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711473628.3/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:廣告顯示管理方法及系統
- 下一篇:基于線索收集的廣告投放引擎系統





