[發明專利]基于風控評分卡模型的用電客戶竊電風險評估方法在審
| 申請號: | 201911264568.3 | 申請日: | 2019-12-11 |
| 公開(公告)號: | CN111178690A | 公開(公告)日: | 2020-05-19 |
| 發明(設計)人: | 李超;黃靜;胡忠;熊磊;李世勉;徐溦;陳西寅;周虎;盧希 | 申請(專利權)人: | 國網重慶市電力公司北碚供電分公司;杭州致成電子科技有限公司 |
| 主分類號: | G06Q10/06 | 分類號: | G06Q10/06;G06Q50/06 |
| 代理公司: | 杭州中利知識產權代理事務所(普通合伙) 33301 | 代理人: | 盧海龍 |
| 地址: | 400700 重慶*** | 國省代碼: | 重慶;50 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 評分 模型 用電 客戶 風險 評估 方法 | ||
1.基于風控評分卡模型的用電客戶竊電風險評估方法,包括以下步驟:
步驟一:數據清洗:對樣本數據的缺失值、冗余值、異常值進行處理,減少異常數據對模型帶來的干擾;
步驟二:特征構造:在原特征的基礎上進行特征衍生,構造更多的特征;
(1)單變量構造:僅使用單個變量進行構造,包括過去7/14/28/56/81天的平均值/最大值/最小值/標準差/中位數;
(2)多變量構造:使用多個變量進行構造,包括多個變量的加/減/乘/除操作;
步驟三:特征分箱和編碼:特征構造完成后,對連續型變量進行分箱操作,對類別型變量進行onehot操作;分箱操作按照最優KS標準來選擇切分點,即在所有滿足上述條件的方案下,選取KS值最高的方案來進行分箱,KS的計算公式如下所示:
其中Badk為第k個分位點中的壞樣本數量,Badtotal為總的壞樣本數量,Goodk為k個分位點中的好樣本數量,Goodtotal為總的好樣本數量,KS越大說明好壞樣本的區分能力越強;分箱操作是編碼的基礎,對每個特征分箱后再進行WOE編碼操作:
步驟四:特征分析:變臉分析包括單特征分析和多特征分析,單特征分析指的是計算單個特征對好壞樣本的區分程度,識別與結果具有高相關性的特征;多特征分析指的是計算特征間的相關性,識別兩兩相關性較高的特征;相關性的計算選用person系數,其計算公式如下所示:
如果兩個特征相關性較高,通常認為相關性絕對值大于0.7為較高,選用IV值較高的特征,刪除較低的特征,IV值的計算公式如下所示:
其中,Goodk和Badk指的是第k個分箱好樣本和壞樣本的數量,Goodtotal和Badtotal指的是總體好壞樣本的數量;
步驟五:模型構造與評價:構造線性回歸模型,計算公式如下所示,其中x為各變量,a為變量的系數,b為截距,
根據回歸模型計算得到每個用戶的竊電評估概率,概率值越高則竊電可能性越大,分析所有樣本數據,遍歷所有的閾值構造ROC曲線,得到auc評價指標,用auc評價指標進行模型評價,現有樣本的auc值達到了0.90,具有較高的好壞樣本區分能力。
2.根據權利要求1所述的基于風控評分卡模型的用電客戶竊電風險評估方法,其特征在于:步驟一中缺失值處理:對樣本數據中缺少關鍵字段的樣本進行刪除,包括竊電日期、竊電戶號,日志數據(電量數據、負荷數據)缺失超過1/3也刪除樣本;冗余值處理:對重復樣本數據進行刪除處理,對重復的日志數據也進行刪除操作;異常值處理:對竊電日期大于當前日期或小于日志表起始日期的樣本進行刪除。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國網重慶市電力公司北碚供電分公司;杭州致成電子科技有限公司,未經國網重慶市電力公司北碚供電分公司;杭州致成電子科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911264568.3/1.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





