[發明專利]一種基于改進聚類算法的不滿意原因溯源方法在審
| 申請號: | 202111568863.5 | 申請日: | 2021-12-21 |
| 公開(公告)號: | CN114444568A | 公開(公告)日: | 2022-05-06 |
| 發明(設計)人: | 徐珊珊;林克;陸向東;朱堅;王雷 | 申請(專利權)人: | 福建新大陸軟件工程有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 福州市鼓樓區京華專利事務所(普通合伙) 35212 | 代理人: | 林燕 |
| 地址: | 350000 福建省福州*** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 改進 算法 不滿意 原因 溯源 方法 | ||
本發明提供了計算機技術領域的一種基于改進聚類算法的不滿意原因溯源方法,包括:步驟S10、獲取大量的不滿意數據,提取各不滿意數據的特征數據,以構建第一特征數據集;步驟S20、剔除第一特征數據集中的異常數據,得到第二特征數據集;步驟S30、基于第二特征數據集選取初始聚類中心特征;步驟S40、基于kmeans聚類算法以及初始聚類中心特征創建一聚類模型,利用聚類模型對第二特征數據集進行聚類,得到若干個聚類簇;步驟S50、從各聚類簇中篩選出強區分度特征;步驟S60、利用聚類模型將待溯源數據聚類至最近的聚類簇;步驟S70、基于強區分度特征以及聚類簇從待溯源數據中溯源出不滿意原因。本發明的優點在于:極大的提升了不滿意原因溯源的效率以及準確性。
技術領域
本發明涉及計算機技術領域,特別指一種基于改進聚類算法的不滿意原因溯源方法。
背景技術
目前,各通信運營商之間的競爭十分激烈,僅依靠網絡、渠道、價格的單方面改革,已經較難獲得競爭優勢,使得競爭從價格競爭逐漸變為服務競爭,了解和滿足客戶的需求、提高客戶滿意度是通信企業獲得競爭力的關鍵。
為了提升競爭力,傳統上,通信企業會定期進行滿意度調研,通過抽樣調查的方式了解目前客戶對通信企業的服務評價,進而對不滿意用戶的各方面進行溯源分析,找到影響客戶滿意度的核心痛點進行有針對性的改進,從而提高客戶滿意度,提升整體競爭力。
由于傳統的方法需要人工介入,基于人工經驗對用戶不滿意原因進行大類的劃分,然后根據用戶實際使用的行為情況,對不滿意用戶進行細化的人工歸類,需要耗費大量的人力成本,且人工劃分的不滿意類別存在覆蓋不全的情況,進而影響不滿意原因溯源的準確性。
因此,如何提供一種基于改進聚類算法的不滿意原因溯源方法,實現提升不滿意原因溯源的效率以及準確性,成為一個亟待解決的技術問題。
發明內容
本發明要解決的技術問題,在于提供一種基于改進聚類算法的不滿意原因溯源方法,實現提升不滿意原因溯源的效率以及準確性。
本發明是這樣實現的:一種基于改進聚類算法的不滿意原因溯源方法,包括如下步驟:
步驟S10、獲取大量的不滿意數據,提取各所述不滿意數據的特征數據,以構建第一特征數據集;
步驟S20、剔除所述第一特征數據集中的異常數據,得到第二特征數據集;
步驟S30、基于所述第二特征數據集選取初始聚類中心特征;
步驟S40、基于kmeans聚類算法以及所述初始聚類中心特征創建一聚類模型,利用所述聚類模型對第二特征數據集進行聚類,得到若干個聚類簇;
步驟S50、從各所述聚類簇中篩選出強區分度特征;
步驟S60、利用所述聚類模型將待溯源數據聚類至最近的聚類簇;
步驟S70、基于所述強區分度特征以及聚類簇從待溯源數據中溯源出不滿意原因。
進一步地,所述步驟S20具體包括:
步驟S21、設定所述第一特征數據集包含N個元素和M列特征,構建大小為N*M的矩陣;
步驟S22、遍歷M列所述特征,分別計算各所述特征對應特征值的均值以及標準差,進而構建特征列均值集合{μ1,μ2,...,μm}和特征列標準差集合{σ1,σ2,...,σm};
步驟S23、基于各所述均值以及標準差分別計算每列特征的異常值上界和異常值下界;
步驟S24、基于所述異常值上界和異常值下界分別計算各特征的偏移度,并對各所述偏移度進行歸一化;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于福建新大陸軟件工程有限公司,未經福建新大陸軟件工程有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111568863.5/2.html,轉載請聲明來源鉆瓜專利網。





