[發明專利]業務分類方法及裝置有效
| 申請號: | 202011413056.1 | 申請日: | 2020-12-07 |
| 公開(公告)號: | CN112200272B | 公開(公告)日: | 2021-02-23 |
| 發明(設計)人: | 顧凌云;謝旻旗;段灣;喬韻如;王震宇 | 申請(專利權)人: | 上海冰鑒信息科技有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N20/10 |
| 代理公司: | 成都頂峰專利事務所(普通合伙) 51224 | 代理人: | 匡睿 |
| 地址: | 200000 上海市浦東新區*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 業務 分類 方法 裝置 | ||
1.一種業務分類方法,其特征在于,應用于服務器,所述方法包括:
對收集到的風控業務場景下的建模樣本集的各維度數據進行特征衍生操作,獲得第一特征集合,其中,所述建模樣本集包括訓練樣本集和測試樣本集,所述第一特征集合包括所述訓練樣本集對應的第一訓練特征集合;
對所述訓練樣本集對應的第一訓練特征集合進行特征選擇和模型構建,獲得滿足預設條件的第一業務分類模型,以及進入所述第一業務分類模型的第二特征集合和未進入所述第一業務分類模型的第三特征集合;
篩選出所述第三特征集合中特征性能評估值大于預設評估值,并且匹配預設區分規則的第一備選特征集,使用機器學習模型對所述第一備選特征集進行模型擬合,輸出所述機器學習模型的概率值,作為第一衍生特征集合;
根據所述第三特征集合對所述建模樣本集進行聚類分析,根據聚類分析結果確定第二衍生特征集合;
根據所述第一衍生特征集合和所述第二衍生特征集合進行模型構建,獲得第二業務分類模型,用于對輸入的待分類樣本進行業務分類,所述篩選出所述第三特征集合中特征性能評估值大于預設評估值,并且匹配預設區分規則的第一備選特征集,使用機器學習模型對所述第一備選特征集進行模型擬合,輸出所述機器學習模型的概率值,作為第一衍生特征集合的步驟,包括:
對所述第三特征集合進行特征性能評估分析,獲得所述第三特征集合的特征性能評估值,并將特征性能評估值大于預設評估值的特征確定為備選特征;
對所述第三特征集合進行業務邏輯分析,選擇滿足以下至少一種條件的特征作為備選特征:特征取值與業務統計率的關系,呈現單調遞增或單調遞減的趨勢,且所述單調遞增或單調遞減的趨勢的幅度滿足預設幅度條件的特征、特征取值與業務統計率的關系在特征取值的不同分箱上的業務統計率差異大于預設差異的特征、被預先定義為對正標簽和負標簽具有區分效果的特征;
將選擇的所有備選特征構建為第一備選特征集,并使用不同的機器學習模型對第一備選特征集進行擬合,獲得不同的機器學習模型對輸出的概率值,作為所述第一衍生特征集合。
2.根據權利要求1所述的業務分類方法,其特征在于,所述對收集到的風控業務場景下的建模樣本集的各維度數據進行特征衍生操作,獲得第一特征集合的步驟,包括:
根據所述建模樣本集的各維度數據的屬性和來源,對所述建模樣本集的各維度數據進行特征工程處理,獲得第一特征集合,其中,所述特征工程處理包括解析衍生處理、數學變換處理、特征交叉與組合處理、分箱衍生處理中的一種或者多種的組合。
3.根據權利要求1所述的業務分類方法,其特征在于,所述對所述訓練樣本集對應的第一訓練特征集合進行特征選擇和模型構建,獲得滿足預設條件的第一業務分類模型,以及進入所述第一業務分類模型的第二特征集合和未進入所述第一業務分類模型的第三特征集合的步驟,包括:
計算所述訓練樣本集對應的第一訓練特征集合中每個訓練特征的重要性程度,并選擇重要性程度大于預設閾值的訓練特征作為進入所述第一業務分類模型的第二特征集合,將重要性程度不大于預設閾值的訓練特征作為未進入所述第一業務分類模型的第三特征集合;
根據所述第二特征集合進行模型構建,獲得AUC數值和KS數值最高的第一業務分類模型。
4.根據權利要求1所述的業務分類方法,其特征在于,所述根據所述第三特征集合對所述建模樣本集進行聚類分析,根據聚類分析結果確定第二衍生特征集合的步驟,包括:
對所述第三特征集合進行特征性能評估分析,獲得所述第三特征集合的特征性能評估值,并將特征性能評估值小于預設評估值的特征確定為剔除特征;
對所述第三特征集合進行業務邏輯分析,選擇特征取值與業務統計率的關系與預設業務邏輯相反的特征作為剔除特征;
從所述第三特征集合中剔除所有選擇的剔除特征,得到第二備選特征集;
使用所述第二備選特征集,對所述訓練樣本集進行K-means聚類分析,根據預先選定的聚類數量確定聚類質心,分別計算所述訓練樣本集各訓練樣本到每個質心之間的距離信息,并將所述距離信息確定為所述第二衍生特征集合,其中,所述距離信息包括歐式距離、曼哈頓距離、切比雪夫距離、余弦距離、標準化歐式距離中的一種。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海冰鑒信息科技有限公司,未經上海冰鑒信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011413056.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:寬分子量硫酸軟骨素制備工藝
- 下一篇:一種測斜管自動旋轉裝置





