[發明專利]一種基于聚類分析的客戶細分方法及裝置在審
| 申請號: | 201810496620.7 | 申請日: | 2018-05-22 |
| 公開(公告)號: | CN108734217A | 公開(公告)日: | 2018-11-02 |
| 發明(設計)人: | 王新剛;王琳琳;孫濤;姜雪松;耿玉水;魯芹;李愛民 | 申請(專利權)人: | 齊魯工業大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06Q30/02 |
| 代理公司: | 濟南圣達知識產權代理有限公司 37221 | 代理人: | 楊哲 |
| 地址: | 250353 山東*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據樣本 自動編碼器 聚類分析 平均距離 樣本點 客戶 樣本 預處理 初始聚類中心 加權歐式距離 歐幾里得距離 原始數據集 變異系數 遍歷數據 公式計算 降序排序 客戶信息 屬性特征 特征提取 數值化 聚類 權重 加權 查找 統計 | ||
1.一種基于聚類分析的客戶細分方法,其特征在于,該方法包括:
獲取客戶信息原始數據集,進行數值化預處理,得到數據樣本,通過自動編碼器對數據樣本進行降維和特征提取;
將自動編碼器處理后的數據樣本采用變異系數法計算屬性特征的權重,并采用加權的歐幾里得距離公式計算樣本點間的距離;
計算所有數據樣本間的平均距離,遍歷數據樣本查找每個樣本點與其距離小于平均距離的近鄰點,統計所有樣本近鄰點數量并按照降序排序,確定初始聚類中心點,將其余的數據根據加權的歐式聚類進行聚類,完成客戶細分工作。
2.如權利要求1所述的方法,其特征在于,在本方法中,進行數值化預處理的具體步驟包括:
將非數值型的數據進行數值化處理;
使用標準化公式處理數值型的數據;
使用歸一化處理公式對經標準化處理的數據進行處理,得到數據樣本。
3.如權利要求1所述的方法,其特征在于,所述通過自動編碼器對數據樣本進行降維和特征提取的具體步驟包括:
將無標簽的原始數據樣本輸入到自動編碼器中的編碼器上進行壓縮編碼,得到code編碼;
采用自動編碼器中的解碼器對code進行解碼操作,得到新數據樣本;
計算新數據樣本和原始數據樣本的誤差,根據誤差調整動編碼器中的編碼器和解碼器的權重參數,通過調整參數后的自動編碼器對數據樣本進行降維和特征提取。
4.如權利要求1所述的方法,其特征在于,在本方法中,改進的k-meams算法包括:
將自動編碼器處理后的數據樣本采用變異系數法計算屬性特征的權重,并采用加權的歐幾里得距離公式計算樣本間的距離,計算所有數據樣本間的平均距離;
遍歷數據樣本查找每個樣本點與其距離小于平均距離的近鄰點,統計所有樣本近鄰點數量并按照降序排序,確定初始聚類中心點。
5.如權利要求4所述的方法,其特征在于,在改進的k-meams算法中將自動編碼器處理后的數據樣本采用變異系數法計算屬性特征的權重,具體步驟包括:
獲取自動編碼器處理后的數據樣本的屬性值矩陣;
計算屬性值矩陣中各維屬性的變異系數;
利用求得的各維屬性的變異系數計算其各屬性特征的權重。
6.如權利要求4所述的方法,其特征在于,在改進的k-meams算法中,所述各維屬性的變異系數根據性值矩陣中各維屬性值的標準差與平均數計算。
7.如權利要求4所述的方法,其特征在于,在改進的k-meams算法中,所述采用加權的歐幾里得距離公式計算樣本點間的距離的具體步驟包括:
根據計算得到的各維屬性的權重,給歐式距離進行賦值加權;
采用加權的歐式距離公式計算數據樣本點間的距離。
8.如權利要求4所述的方法,其特征在于,在改進的k-meams算法中,所述確定初始聚類中心點的具體步驟包括:
任選一數據樣本點,查找與其距離小于平均距離的所有樣本點,作為該數據樣本點的近鄰點,并計算近鄰點的數量;
遍歷數據樣本查找每個樣本點與其距離小于平均距離的近鄰點,統計所有樣本近鄰點數量并按照降序排序;
選擇近鄰點數目最高的樣本點作為第一個初始聚類中心點,若樣本點為初始聚類中心點的近鄰點則忽略,以此類推遍歷所有樣本點直至確定k個初始聚類中心點。
9.一種計算機可讀存儲介質,其中存儲有多條指令,其特征在于,所述指令適于由終端設備的處理器加載并執行根據權利要求1-8中任一項所述的方法。
10.一種終端設備,包括處理器和計算機可讀存儲介質,處理器用于實現各指令;計算機可讀存儲介質用于存儲多條指令,其特征在于,所述指令用于執行根據權利要求1-8中任一項所述的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于齊魯工業大學,未經齊魯工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810496620.7/1.html,轉載請聲明來源鉆瓜專利網。





