[發(fā)明專利]一種基于客戶屬性及行為特征分析的客戶細(xì)分方法在審
| 申請(qǐng)?zhí)枺?/td> | 201310529336.2 | 申請(qǐng)日: | 2013-10-31 |
| 公開(公告)號(hào): | CN103559630A | 公開(公告)日: | 2014-02-05 |
| 發(fā)明(設(shè)計(jì))人: | 陳建林;吳曉聲;肖宇;薛云;蔡倩華;胡曉暉 | 申請(qǐng)(專利權(quán))人: | 華南師范大學(xué) |
| 主分類號(hào): | G06Q30/02 | 分類號(hào): | G06Q30/02 |
| 代理公司: | 廣州粵高專利商標(biāo)代理有限公司 44102 | 代理人: | 江裕強(qiáng) |
| 地址: | 510275 廣東*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 客戶 屬性 行為 特征 分析 細(xì)分 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及數(shù)據(jù)挖掘領(lǐng)域,具體涉及一種基于客戶屬性及行為特征分析的客戶細(xì)分方法。
背景技術(shù)
現(xiàn)有的客戶行為細(xì)分方法歸納起來,主要有以下幾種:
基于RFM(Recency?Frequency?Monetary)模型行為細(xì)分的方法。
在RFM模型是衡量客戶價(jià)值和客戶創(chuàng)利能力的重要工具和手段。R(recency)指上次購(gòu)買至現(xiàn)在的時(shí)間間隔,F(xiàn)(frequency)為某一期間內(nèi)的購(gòu)買次數(shù),M(monetary)是某一期間內(nèi)購(gòu)買的金額。RFM分析針對(duì)每個(gè)客戶的每個(gè)指標(biāo)打分,然后計(jì)算三個(gè)指標(biāo)的乘積,再按這個(gè)結(jié)果排序,在此基礎(chǔ)上將所有的客戶按照20%、60%、20%分類,最后對(duì)不同類型的客戶實(shí)施不同的策略。
RFM分析的因素都是行為方面的,這次信息對(duì)于擁有數(shù)據(jù)庫(kù)的公司來說比較容易獲得,然而購(gòu)買次數(shù)F和同期總購(gòu)買額M兩個(gè)變量之間會(huì)存在多重線性。另外該模型選擇的屬性太少,以致于不能很全面地對(duì)客戶的行為特征進(jìn)行細(xì)分。而且按照20%、60%、20%將客戶分類的結(jié)果不一定能反映出客戶的實(shí)際分類群體;只實(shí)現(xiàn)了客戶群體這一維上的聚類,并不能體現(xiàn)出屬性差距。
客戶價(jià)值矩陣的方法:
該矩陣用包括客戶代碼、購(gòu)買日期、日購(gòu)買額等屬性來進(jìn)行客戶行為細(xì)分。購(gòu)買次數(shù)由不同購(gòu)買日期的數(shù)目來確定,平均購(gòu)買額等于在指定時(shí)間間隔內(nèi)總購(gòu)買額(日購(gòu)買額的總和)與購(gòu)買次數(shù)的比值。最終所有客戶都分散在事先確定的二維矩陣的四個(gè)象限中,針對(duì)每一個(gè)客戶群或跨越客戶群產(chǎn)生不同的營(yíng)銷戰(zhàn)略或戰(zhàn)術(shù)。
它的缺點(diǎn)是也只局限于特定的屬性,不能根據(jù)不同數(shù)據(jù)特點(diǎn)的屬性集來選擇屬性。而且它所選擇的屬性不夠全面,不能很好地對(duì)客戶行為進(jìn)行描述。另外它只實(shí)現(xiàn)了客戶群體這一維上的聚類,只是全局性地聚類,不能對(duì)局部特征相似的群體進(jìn)行聚類。
發(fā)明內(nèi)容
本發(fā)明針對(duì)目前客戶行為細(xì)分存在的不足和缺陷,提供一種結(jié)合屬性選擇、群體聚類和雙聚類的方法來達(dá)到客戶行為細(xì)分的目的,本發(fā)明通過如下技術(shù)方案實(shí)現(xiàn)。
該方法包括如下步驟:
(1)數(shù)據(jù)預(yù)處理:首先,獲取航空公司的會(huì)員數(shù)據(jù)矩陣,共有P個(gè)樣本,每個(gè)樣本有Q個(gè)屬性,P、Q為大于1的正整數(shù),其中每行代表一位客戶亦為一條記錄,每列代表客戶的屬性,其中每個(gè)元素代表公司對(duì)一個(gè)客戶的行為評(píng)分;選擇Q個(gè)屬性中的一個(gè)作為分類屬性,對(duì)剩下的Q-1個(gè)屬性與分類屬性之間進(jìn)行相關(guān)性分析,去除Q個(gè)屬性中的弱相關(guān)項(xiàng)與冗余項(xiàng),得到屬性集;
(2)用K-means算法將上述得到的屬性集中的每個(gè)元素的原始數(shù)據(jù)聚成L類,L為大于1的正整數(shù),按數(shù)據(jù)的數(shù)值由小到大劃分為L(zhǎng)個(gè)級(jí)別,原先的數(shù)據(jù)值將由這些級(jí)別代替,得到新的屬性集;然后采用基于密度可達(dá)的DBSCAN算法將新屬性集中每個(gè)客戶即是每條記錄進(jìn)行聚類;
(3)行為特征聚類:用基于apriori的雙聚類分別對(duì)步驟(2)的聚類結(jié)果做行為特征聚類,得到屬性值相同、行為特征近似的客戶屬性矩陣;由客戶屬性矩陣可以得到某些屬性數(shù)值相同,即行為表現(xiàn)相近,具有相似的行為習(xí)慣的客戶群。
進(jìn)一步地,步驟(1)中,選擇Q個(gè)屬性中的一個(gè)作為分類屬性,再利用皮爾遜卡方統(tǒng)計(jì)量度量分類屬性與剩下的Q-1個(gè)屬性的相關(guān)性,按照相關(guān)性排列Q-1屬性,并將屬性劃分為三個(gè)等級(jí):強(qiáng)相關(guān)、相關(guān)、弱相關(guān),去除上述弱相關(guān)屬性及強(qiáng)相關(guān)屬性中的冗余重復(fù)屬性,選擇出與分類屬性相關(guān)并相互獨(dú)立的屬性,具體包括如下步驟:
(1.1)選擇分類屬性后,利用列聯(lián)表計(jì)算出Q-1屬性與分類屬性的皮爾遜卡方統(tǒng)計(jì)量K,皮爾遜卡方統(tǒng)計(jì)量其中,ni表示列聯(lián)表中第i行的數(shù)值總和,nj表示列聯(lián)表中第j列的數(shù)值總和,nij表示表示列聯(lián)表第i行第j列的數(shù)值,n表示列聯(lián)表中所有數(shù)值的總和;
(1.2)按照皮爾遜卡方統(tǒng)計(jì)量的大小,將所有屬性聚成三類,即強(qiáng)相關(guān)子集(SSR)、相關(guān)子集(SR)、弱相關(guān)子集(SWR)。并選擇強(qiáng)相關(guān)子集中K值最小的屬性為最弱強(qiáng)相關(guān)屬性FW,選擇弱相關(guān)屬性中K值最大的屬性為最強(qiáng)弱相關(guān)屬性FS。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于華南師范大學(xué),未經(jīng)華南師范大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310529336.2/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測(cè)目的的數(shù)據(jù)處理系統(tǒng)或方法;其他類目不包含的專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測(cè)目的的處理系統(tǒng)或方法
G06Q30-00 商業(yè),例如購(gòu)物或電子商務(wù)
G06Q30-02 .行銷,例如,市場(chǎng)研究與分析、調(diào)查、促銷、廣告、買方剖析研究、客戶管理或獎(jiǎng)勵(lì);價(jià)格評(píng)估或確定
G06Q30-04 .簽單或開發(fā)票
G06Q30-06 .購(gòu)買、出售或租賃交易
G06Q30-08 ..拍賣
- 過濾以及監(jiān)控程序的行為的方法
- 數(shù)據(jù)挖掘的方法和裝置
- 網(wǎng)絡(luò)異常行為檢測(cè)方法及檢測(cè)裝置
- 基于大數(shù)據(jù)關(guān)聯(lián)規(guī)則挖掘的異常行為檢測(cè)方法和系統(tǒng)
- 用于檢測(cè)用戶行為的方法和裝置
- 行為數(shù)據(jù)分析方法及裝置
- 一種基于網(wǎng)絡(luò)的行為教育方法
- 網(wǎng)絡(luò)行為分類方法、設(shè)備、存儲(chǔ)介質(zhì)及裝置
- 一種在線支付業(yè)務(wù)行為的異常檢測(cè)方法、裝置及電子設(shè)備
- 行為采集方法及系統(tǒng)





