[發(fā)明專利]評分卡模型衍生標簽生成方法、裝置、設備及存儲介質在審
| 申請?zhí)枺?/td> | 201911096223.1 | 申請日: | 2019-11-11 |
| 公開(公告)號: | CN110879821A | 公開(公告)日: | 2020-03-13 |
| 發(fā)明(設計)人: | 楊良志;白琳;汪志新;周光輝;張奇;張卓 | 申請(專利權)人: | 彩訊科技股份有限公司 |
| 主分類號: | G06F16/2458 | 分類號: | G06F16/2458;G06K9/62;G06Q10/06 |
| 代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 孟金喆 |
| 地址: | 518000 廣東省深圳市南山區(qū)*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 評分 模型 衍生 標簽 生成 方法 裝置 設備 存儲 介質 | ||
本發(fā)明實施例公開了一種評分卡模型衍生標簽生成方法、裝置、設備及存儲介質,所述方法包括:獲取樣本數(shù)據(jù);通過關聯(lián)分析獲取所述樣本數(shù)據(jù)的分析參數(shù);通過預設規(guī)則獲取所述分析參數(shù)的排序參數(shù);根據(jù)所述排序參數(shù)對所述樣本數(shù)據(jù)進行分箱操作,生成樣本衍生標簽;根據(jù)所述樣本衍生標簽生成評分卡模型的衍生標簽。本發(fā)明實施例使評分卡模型做特征工程的時候不局限于標簽的單變量分析,能夠生成具有強指向性的衍生標簽,為后續(xù)的評分卡模型提供了大量可用的標簽分箱,從而提高評分卡模型的精準性。
技術領域
本發(fā)明實施例涉及計算機技術領域,尤其涉及一種評分卡模型衍生標簽生成方法、裝置、設備及存儲介質。
背景技術
目前主流的獲客及風控大數(shù)據(jù)建模方法是評分卡模型。評分卡模型是通過運用先進的數(shù)據(jù)挖掘技術和統(tǒng)計分析方法,對用戶特征的大量數(shù)據(jù)進行系統(tǒng)的分析,挖掘數(shù)據(jù)中蘊含的行為模式和特征,捕捉歷史信息和未來行為表現(xiàn)之間的關系,發(fā)展出預測性的模型,以一個評分來總和評估用戶未來的某種表現(xiàn)。
在使用算法計算之前,需要分析數(shù)據(jù),并將數(shù)據(jù)格式調節(jié)成符合算法邏輯的形式,即特征工程,這也是機器學習建模的關鍵部分。特征工程中衍生標簽的質量,對最終建模效果至關重要。傳統(tǒng)的評分卡模型在特征工程中,只是進行粗略的單變量分析,依靠現(xiàn)成標簽進入模型,往往會導致關鍵信息遺漏,致使建模精準性欠缺。
發(fā)明內容
有鑒于此,本發(fā)明實施例提供一種評分卡模型衍生標簽生成方法、裝置、設備及存儲介質,以加強評分卡模型特征工程中標簽的指向性,提高評分卡模型擬合效果。
第一方面,本發(fā)明實施例提供一種評分卡模型衍生標簽生成方法,包括:
獲取樣本數(shù)據(jù);
通過關聯(lián)分析獲取所述樣本數(shù)據(jù)的分析參數(shù);
通過預設規(guī)則獲取所述分析參數(shù)的排序參數(shù);
根據(jù)所述排序參數(shù)對所述樣本數(shù)據(jù)進行分箱操作,生成樣本衍生標簽;
根據(jù)所述樣本衍生標簽生成評分卡模型的衍生標簽。
進一步的,所述通過關聯(lián)分析獲取所述樣本數(shù)據(jù)的分析參數(shù)包括:
通過Apriori關聯(lián)算法獲取所述樣本數(shù)據(jù)的分析參數(shù)。
進一步的,所述分析參數(shù)包括:支持度、置信度、覆蓋度、力度、提升度和利用度中的一種或多種。
進一步的,所述通過預設規(guī)則獲取所述分析參數(shù)的排序參數(shù)包括:
通過熵權法獲取所述分析參數(shù)的排序參數(shù)。
進一步的,所述根據(jù)所述樣本衍生標簽生成評分卡模型的衍生標簽包括:
判斷預設評分卡模型數(shù)據(jù)是否在所述樣本衍生標簽確定的范圍內;
若預設評分卡模型數(shù)據(jù)在所述樣本衍生標簽確定的范圍內,則將所述樣本衍生標簽作為評分卡模型的衍生標簽。
進一步的,所述通過關聯(lián)分析獲取所述樣本數(shù)據(jù)的分析參數(shù)之前,還包括:
對所述樣本數(shù)據(jù)進行預處理。
進一步的,所述根據(jù)所述樣本衍生標簽生成評分卡模型的衍生標簽之后,還包括:
對所述衍生標簽進行邏輯回歸計算以確定包括所述衍生標簽后的評分卡模型的性能。
第二方面,本發(fā)明實施例提供一種評分卡模型衍生標簽生成裝置,包括:
樣本數(shù)據(jù)獲取模塊,用于獲取樣本數(shù)據(jù);
分析參數(shù)獲取模塊,用于通過關聯(lián)分析獲取所述樣本數(shù)據(jù)的分析參數(shù);
排序參數(shù)獲取模塊,用于通過預設規(guī)則獲取所述分析參數(shù)的排序參數(shù);
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于彩訊科技股份有限公司,未經彩訊科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911096223.1/2.html,轉載請聲明來源鉆瓜專利網。





