[發明專利]基于GBDT和LR融合的電力投訴客戶識別方法、系統在審
| 申請號: | 202211671180.7 | 申請日: | 2022-12-26 |
| 公開(公告)號: | CN116050589A | 公開(公告)日: | 2023-05-02 |
| 發明(設計)人: | 姜磊;甄學文;杜利明;姚章根;楊軍倉;杜雙育 | 申請(專利權)人: | 佰聆數據股份有限公司 |
| 主分類號: | G06Q10/04 | 分類號: | G06Q10/04;G06Q30/01;G06Q50/06;G06F18/2113;G06F18/214;G06F18/24;G06N5/01;G06N20/20 |
| 代理公司: | 廣州市華學知識產權代理有限公司 44245 | 代理人: | 林梅繁 |
| 地址: | 510663 廣東省廣州市高新技術產業開*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 gbdt lr 融合 電力 投訴 客戶 識別 方法 系統 | ||
本發明涉及電力數據分析領域,為基于GBDT和LR融合的電力投訴客戶識別方法、系統,包括:獲取與電力客戶投訴識別相關的數據;數據預處理;改善樣本數據的分類不平衡問題及進行樣本數據的隨機抽取;構建梯度提升決策樹模型,使用梯度提升決策樹模型建樹,構造新的組合特征;構建邏輯回歸模型,將梯度提升決策樹模型構造的新的組合特征與原始數據特征組合合并,應用于邏輯回歸模型進行分類訓練,最終得到樣本分類的融合預測模型;將電力客戶特征輸入融合預測模型,得到電力客戶投訴預測的結果。本發明通過優化GBDT的特征選擇算法,實現客戶特征自動篩選,再通過融合LR回歸分類算法,準確地完成客戶投訴識別與預測。
技術領域
本發明涉及電力數據分析技術領域,特別涉及基于GBDT(Gradient?BoostingDecision?Tree,梯度提升決策樹)和LR(邏輯回歸模型)融合的電力投訴客戶識別方法、系統。
背景技術
隨著經濟的飛速發展以及信息化技術的深入推進,電力需求越來越多,伴隨電力相關業務產生的數據也呈現爆發式增長。電力客戶和客戶需求不斷增長的同時,客戶對電力服務的要求以及維權意識也在不斷提升;客戶作為電力的直接使用者,在質量或服務出現問題時,會通過各種途徑進行投訴。
客戶因用電服務等產生的投訴問題需要引起重視。因此,對客戶投訴數據進行深度分析與挖掘,獲取客戶隱含需求,建立一套完整有效的投訴客戶識別模型,提前預知或避免潛在客戶投訴行為,對準確分析和區分電力客戶,提供個性化服務,降低投訴風險,提升客戶滿意度,延長客戶生命周期有著重要意義。
目前,電力客戶投訴的研究與應用主要是對未來投訴量的預測,針對當前的投訴識別或可能投訴預測研究較少。業內多數通過不同維度直接選取客戶特征,利用經典機器學習方法分析,得到客戶投訴預測分類結果;但在從多維復雜的數據中選取客戶特征后,需要人工取變量值,由于對關鍵因素缺乏全面了解,導致模型過擬合或者欠擬合;同時由于電力投訴數據較復雜和行業特性較強,采用傳統的機器學習方法進行模型訓練,導致業務深度和精度不夠。
發明內容
為了克服現有技術所存在的缺陷,本發明提出基于GBDT和LR融合的電力投訴客戶識別方法、系統,通過優化GBDT的特征選擇算法,實現客戶特征自動篩選,再通過融合LR回歸分類算法,準確地完成客戶投訴識別與預測。
本發明方法采用如下技術方案來實現:一種基于GBDT和LR融合的電力投訴客戶識別方法,包括以下步驟:
獲取與電力客戶投訴識別相關的數據,確定建立模型需要的數據范圍、時間窗口;
數據預處理;
改善樣本數據的分類不平衡問題及進行樣本數據的隨機抽取;
構建梯度提升決策樹模型,使用梯度提升決策樹模型建樹,構造新的組合特征;
構建邏輯回歸模型,將梯度提升決策樹模型構造的新的組合特征與原始數據特征組合合并,應用于邏輯回歸模型進行分類訓練,最終得到樣本分類的融合預測模型;
將電力客戶特征輸入融合預測模型,得到的輸出結果即為電力客戶投訴預測的結果。
優選地,所述改善樣本數據的分類不平衡問題及進行樣本數據的隨機抽取,具體為:
將未投訴過的客戶標記為負類樣本,投訴過的客戶標記為正類樣本;
采用ROSE算法對負類樣本進行過采樣,借助平滑自助法和核方法,將負類樣本從低維特征空間映射到高維特征空間,并通過條件核密度進行估計、合成新的樣本,獲得均衡的負類樣本和正類樣本;
采用隨機分割的方式,從負類樣本和正類樣本中選取部分樣本作為訓練集,并將剩余部分樣本作為測試集。
優選地,所述構建梯度提升決策樹模型,使用梯度提升決策樹模型建樹,構造新的組合特征,具體包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于佰聆數據股份有限公司,未經佰聆數據股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211671180.7/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種帶有測溫功能的自動化儀表
- 下一篇:一種用于縱剪機的防護型進料導軌
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





