[發明專利]一種數據處理方法、系統、存儲介質及電子設備在審
| 申請號: | 202211639589.0 | 申請日: | 2022-12-20 |
| 公開(公告)號: | CN115879981A | 公開(公告)日: | 2023-03-31 |
| 發明(設計)人: | 陳彥聰;嚴思齊;龍江 | 申請(專利權)人: | 中國建設銀行股份有限公司廣東省分行 |
| 主分類號: | G06Q30/0201 | 分類號: | G06Q30/0201;G06Q30/0202;G06Q40/03 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 黃水娜 |
| 地址: | 510030 *** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 數據處理 方法 系統 存儲 介質 電子設備 | ||
1.一種數據處理方法,其特征在于,所述方法包括:
獲取待處理數據;所述待處理數據表征經過變量篩選操作后的無多重共線性的變量;
通過預先構建的營銷響應模型,對所述待處理數據進行模型評估,得到概率結果;所述概率結果為通過所述營銷響應模型預測得到的營銷響應率的概率結果;
通過所述模型概率結果,確定各個得分區間;所述各個得分區間為未授信客戶的營銷評分區間;
確定所述各個得分區間的所有樣本數和預測營銷成功的樣本個數;
通過所述各個得分區間的所有樣本數和所述預測營銷成功的樣本個數,確定各得分區間的模型響應率;
當所述模型響應率大于等于預設閾值時,根據所述模型響應率確定對應的營銷資源。
2.根據權利要求1所述的方法,其特征在于,所述獲取待處理數據,包括:
獲取原始變量;所述原始變量為未經過變量篩選操作的變量;
對所述原始變量進行卡方分箱,得到各個分箱后的變量;所述卡方分箱用于判斷相鄰兩個區間是否有分布差異;
當各個分箱后的變量符合預設變量條件時,獲取各個分箱后的變量對應的信息值;所述預設變量條件由分箱后每個箱體的依次遞增的營銷響應率、在每個區間防止樣本偏移條件和每個區間的特征變換值確定;
選取在預設閾值范圍內各個分箱后的變量對應的信息值,并通過預設剔除算法剔除在預設閾值范圍內各個分箱后的變量對應的信息值中的冗余變量,得到待處理數據。
3.根據權利要求1所述的方法,其特征在于,構建營銷響應模型的過程,包括:
獲取預設比例的樣本數據;所述樣本數據至少包括正樣本和負樣本;所述正樣本表征預設時段內有授信記錄的樣本數據;所述負樣本為在所述預設時段內沒有授信記錄的樣本數據;
獲取原始變量;所述原始變量為未經過變量篩選操作的變量;
對所述原始變量進行變量衍生,得到所述原始變量對應的衍生變量;
對所述原始變量和所述衍生變量進行數據分析;所述數據分析至少包括構建所述營銷響應模型所需的各個數據表之間主鍵關系分析、數據完備性檢查和數據質量檢查;
將分析后的原始變量和分析后的衍生變量確定為建模樣本,并通過所述建模樣本和預設模型算法構建營銷響應模型。
4.根據權利要求1所述的方法,其特征在于,所述通過所述模型概率結果,確定各個得分區間,包括:
對所述模型概率結果進行評分轉換,得到各個得分區間。
5.根據權利要求1所述的方法,其特征在于,所述確定所述各個得分區間的所有樣本數和預測營銷成功的樣本個數,包括:
統計所述各個得分區間的所有樣本數;
在預設時段內,當監測到簽約的預設營銷產品時,統計所有樣本數中簽約的預設營銷產品所對應的樣本數,并將所有樣本數中簽約的預設營銷產品所對應的樣本數確定為預測營銷成功的樣本個數。
6.根據權利要求1所述的方法,其特征在于,還包括:
通過預設評估指標,對所述營銷響應模型進行模型評估。
7.根據權利要求1所述的方法,其特征在于,還包括:
通過預設測算方式,測算所述營銷響應模型的預授信額度;
通過所述預授信額度測算信用產品的額度。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國建設銀行股份有限公司廣東省分行,未經中國建設銀行股份有限公司廣東省分行許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211639589.0/1.html,轉載請聲明來源鉆瓜專利網。





