[發明專利]一種基于K-means的醫療消費客戶自動分類方法在審
| 申請號: | 201810477477.7 | 申請日: | 2018-05-18 |
| 公開(公告)號: | CN108664653A | 公開(公告)日: | 2018-10-16 |
| 發明(設計)人: | 古萬榮;施玉健;毛宜軍;李海良;朱韜 | 申請(專利權)人: | 拓普暨達(廣州)基因精準醫療科技有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06K9/62;G06Q30/02 |
| 代理公司: | 廣州市華學知識產權代理有限公司 44245 | 代理人: | 馮炳輝 |
| 地址: | 510623 廣東省廣州市天河區珠*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 客戶 客戶分類 自動分類 使用機器 特征向量 消費客戶 算法 客戶數據庫 分類標準 聚類結果 人力物力 提取數據 分類 構建 聚類 醫療 學習 統計 | ||
1.一種基于K-means的醫療消費客戶自動分類方法,其特征在于,包括以下步驟:
S1、從客戶數據庫中統計提取數據;
S2、按照CRM方法,根據客戶的年消費頻率和客戶的年消費總金額構建客戶分類模型;
S3、使用步驟S2的客戶分類模型,獲取每個客戶的特征向量;
S4、使用機器學習K-means算法對步驟S3中求得的特征向量進行聚類;
S5、使用步驟S4所得的聚類結果作為客戶分類的結果,從而實現對客戶的分類。
2.根據權利要求1所述的一種基于K-means的醫療消費客戶自動分類方法,其特征在于:在步驟S1中,從客戶相關的數據庫中,通過查詢獲取客戶的基本信息和通過聚合函數統計出每個客戶的年消費頻率和年消費金額,以此作為自動分類方法的輸入數據。
3.根據權利要求1所述的一種基于K-means的醫療消費客戶自動分類方法,其特征在于:在步驟S2中,使用客戶的年消費頻率為橫坐標,以年消費總金額作為縱坐標,構建出客戶客戶分類模型。
4.根據權利要求1所述的一種基于K-means的醫療消費客戶自動分類方法,其特征在于:在步驟S2中,所述的CRM方法是一種用于改善企業和客戶之間關系的新型管理方法,其中客戶關系管理中的一個重要環節就是客戶細分,所述客戶細分實質是一種將一個大的客戶群或者消費者群體劃分成多個分類群體的方法,這些群體中同屬于一個分類群體的客戶或者消費者的彼此特性相似。
5.根據權利要求1所述的一種基于K-means的醫療消費客戶自動分類方法,其特征在于:在步驟S3中,利用步驟S2中建立的客戶分類模型,獲取每個客戶的特征向量,此處的輸入數據恰好包含客戶分類模型的兩個維度,因此直接以步驟S1中的每一個客戶的數據輸入作為該客戶的特征向量。
6.根據權利要求1所述的一種基于K-means的醫療消費客戶自動分類方法,其特征在于:在步驟S4中,使用步驟S3的客戶特征向量作為K-means算法的輸入,執行K-means算法對客戶進行分類,其中K-means算法的聚類過程分為以下三個步驟:
S41、初始化聚類中心
通過在數據集中隨機尋找k個樣本,以這k個樣本作為本次聚類過程的三個初始聚類中心;
S42、分配過程
設t表示迭代次數,為第t次迭代的第i個簇,表示第t次迭代的第i個聚類中心,表示第t次迭代的第j個聚類中心,xp表示被分配的數據點,k為所需要的聚類數目,有如下公式:
該公式反映了K-means算法在聚類的過程中的依據,即分配數據點,使得被分配點xp到所屬簇的聚類中心的距離最小;
S43、更新過程
設為第t+1次迭代的第i個聚類中心,為第t次迭代的第i個簇,xj表示中的第j數據點;對分配過程中得到的簇,重新計算聚類中心,有如下公式:
該公式反映了K-means算法在更新聚類中心時的做法,即計算簇中所有數據點的均值,依次作為該簇新的聚類中心;
其中,所述的簇為聚類算法運算后得到的某一個分組,所述的聚類中心為聚類算法所得到的分組的中心點。
7.根據權利要求1所述的一種基于K-means的醫療消費客戶自動分類方法,其特征在于:在步驟S5中,應用步驟S4得到聚類結果作為客戶的分類結果,具體分類類別為勤儉型客戶、經濟型客戶和小資型客戶三種。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于拓普暨達(廣州)基因精準醫療科技有限公司,未經拓普暨達(廣州)基因精準醫療科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810477477.7/1.html,轉載請聲明來源鉆瓜專利網。





