[發(fā)明專利]一種基于聚類分析的客戶細分方法及裝置在審
| 申請?zhí)枺?/td> | 201810496620.7 | 申請日: | 2018-05-22 |
| 公開(公告)號: | CN108734217A | 公開(公告)日: | 2018-11-02 |
| 發(fā)明(設計)人: | 王新剛;王琳琳;孫濤;姜雪松;耿玉水;魯芹;李愛民 | 申請(專利權(quán))人: | 齊魯工業(yè)大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06Q30/02 |
| 代理公司: | 濟南圣達知識產(chǎn)權(quán)代理有限公司 37221 | 代理人: | 楊哲 |
| 地址: | 250353 山東*** | 國省代碼: | 山東;37 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數(shù)據(jù)樣本 自動編碼器 聚類分析 平均距離 樣本點 客戶 樣本 預處理 初始聚類中心 加權(quán)歐式距離 歐幾里得距離 原始數(shù)據(jù)集 變異系數(shù) 遍歷數(shù)據(jù) 公式計算 降序排序 客戶信息 屬性特征 特征提取 數(shù)值化 聚類 權(quán)重 加權(quán) 查找 統(tǒng)計 | ||
本發(fā)明公開了一種基于聚類分析的客戶細分方法及裝置,該方法包括:獲取客戶信息原始數(shù)據(jù)集,進行數(shù)值化預處理,得到數(shù)據(jù)樣本,通過自動編碼器對數(shù)據(jù)樣本進行降維和特征提取;將自動編碼器處理后的數(shù)據(jù)樣本采用變異系數(shù)法計算屬性特征的權(quán)重,并采用加權(quán)的歐幾里得距離公式計算樣本點間的距離;計算所有數(shù)據(jù)樣本間的平均距離,遍歷數(shù)據(jù)樣本查找每個樣本點與其距離小于平均距離的近鄰點,統(tǒng)計所有樣本近鄰點數(shù)量并按照降序排序,確定k個初始聚類中心點,根據(jù)加權(quán)歐式距離公式對其余數(shù)據(jù)進行聚類,完成客戶細分工作。
技術領域
本發(fā)明屬于市場統(tǒng)計及營銷的技術領域,涉及的是一種基于聚類分析的客戶細分方法及裝置。
背景技術
伴隨著科技的飛速發(fā)展,計算機的普及使用,網(wǎng)絡已悄無聲息的滲透于我們?nèi)粘5姆椒矫婷妗,F(xiàn)如今,人們使用數(shù)據(jù)挖掘技術從各領域中尋找有價值的信息變的越來越重要,這樣不僅可以總結(jié)出過往的發(fā)展情況,而且還可以預測出數(shù)據(jù)未來的發(fā)展趨勢。其中,客戶細分是一個重要的研究領域。通過聚類分析的方法,并根據(jù)客戶的相似性和相異性將他們劃分成不同的類,方便企業(yè)發(fā)現(xiàn)不同類型的客戶,從而制定差異化的銷售方案,實現(xiàn)企業(yè)利潤的更大化,所以,如何對客戶細分成為了企業(yè)獲得更大利潤的關鍵所在。目前,在客戶細分體系中主要存在著如下的問題:
第一,客戶細分體系在處理顧客信息時,面臨著數(shù)據(jù)量大,且數(shù)據(jù)的屬性較多、數(shù)據(jù)的維度較高的問題,倘若直接選用這些原始數(shù)據(jù)進行聚類分析,不僅導致客戶細分的效率較低,計算步驟繁瑣,也會使客戶細分時間過長。
第二,在客戶細分系統(tǒng)研究中,傳統(tǒng)的k-means聚類算法是最常見的應用算法之一,但該算法在聚類過程中對所有數(shù)據(jù)樣本的屬性等同對待,未考慮不同的屬性間的差異。然而,不同的屬性的重要性是不同的,對聚類效果也產(chǎn)生著不同的影響,一般而言,重要的屬性對聚類效果產(chǎn)生較大的影響。
第三,傳統(tǒng)的k-means算法在聚類時,對初始聚類中心點的選擇比較敏感,存在隨機選取初始聚類中心點的盲目性問題。通常,初始聚類中心點選擇的好壞會對聚類結(jié)果產(chǎn)生較大的影響,一旦選取不當可能會使聚類效果達到局部最優(yōu)而不是全局最優(yōu),而且也會增加算法的迭代次數(shù),降低算法的收斂速度。
綜上所述,針對現(xiàn)有技術中如何更好的進行客戶細分的問題,尚缺乏有效的解決方案。
發(fā)明內(nèi)容
針對現(xiàn)有技術中存在的不足,解決現(xiàn)有技術中如何更好的進行客戶細分的問題,本發(fā)明提供了一種基于聚類分析的客戶細分方法及裝置,在客戶細分中,根據(jù)客戶的消費習慣將他們聚集為不同的類,為針對不同類的客戶提出不同的營銷策略提供基礎。
本發(fā)明的第一目的是提供一種基于聚類分析的客戶細分方法。
為了實現(xiàn)上述目的,本發(fā)明采用如下一種技術方案:
一種基于聚類分析的客戶細分方法,該方法包括:
獲取客戶信息數(shù)據(jù)集,進行數(shù)值化預處理,得到數(shù)據(jù)樣本,通過自動編碼器對數(shù)據(jù)樣本進行降維和特征提取;
將自動編碼器處理后的數(shù)據(jù)樣本采用變異系數(shù)法計算屬性特征的權(quán)重,并采用加權(quán)的歐幾里得距離公式計算樣本點間的距離;
計算所有數(shù)據(jù)樣本間的平均距離,遍歷數(shù)據(jù)樣本查找每個樣本點與其距離小于平均距離的近鄰點,統(tǒng)計所有樣本近鄰點數(shù)量并降序排序,確定初始聚類中心點,進行其余數(shù)據(jù)點聚類,得到不同類的客戶,完成客戶細分工作。
作為進一步的優(yōu)選方案,在本方法中,進行數(shù)值化預處理的具體步驟包括:
將非數(shù)值型的數(shù)據(jù)進行數(shù)值化處理;
使用標準化公式處理數(shù)值型的數(shù)據(jù);
使用歸一化處理公式對經(jīng)標準化處理的數(shù)據(jù)進行處理,得到數(shù)據(jù)樣本。
該專利技術資料僅供研究查看技術是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于齊魯工業(yè)大學,未經(jīng)齊魯工業(yè)大學許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810496620.7/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





