日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]對數據自動分箱的方法及裝置有效

專利信息
申請號: 201910362666.4 申請日: 2019-04-30
公開(公告)號: CN110084376B 公開(公告)日: 2021-05-14
發明(設計)人: 李驥東;何智福;藍科;覃進學 申請(專利權)人: 成都四方偉業軟件股份有限公司
主分類號: G06N20/00 分類號: G06N20/00;G06F17/11;G06F17/16
代理公司: 北京超凡宏宇專利代理事務所(特殊普通合伙) 11463 代理人: 徐麗
地址: 610000 四川省*** 國省代碼: 四川;51
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 數據 自動 方法 裝置
【說明書】:

發明涉及數據處理技術領域,具體涉及一種對數據自動分箱的方法及裝置,該方法具體包括:獲取用戶輸入的基本特征數據以及分箱條件,將分箱條件帶入預定義函數得到目標函數,根據分箱條件確定初始向量,將初始向量帶入目標函數確定對基本特征數據的搜索方向。進而以初始向量為基準點按照搜索方向對初始向量進行調整并帶入目標函數得到對應的函數值,當后一個函數值與當前函數值的差值小于預設收斂精度,則確定后一個函數值對應的初始向量作為分割點,最后依據確定的多個分割點對用戶輸入的基本特征數據進行分箱。通過本方案可實現快速分箱,使得各個分箱之間的關聯程度最低,進而便于對用戶輸入的數據進行客觀評分操作。

技術領域

本發明涉及數據處理技術領域,具體而言,涉及一種對數據自動分箱的方法及裝置。

背景技術

隨著大數據、人工智能技術的發展和普及,越來越多的金融機構增加了對機器學習的重視程度,將傳統基于人工決策的管理方法逐步轉變為以數據驅動為基礎的智能化決策。特別是在銀行個人金融業務中,如信用卡業務、消費金融業務等領域,因其單筆金額小、申請頻率高、時效要求高等原因,導致使用傳統人工審批的方式無法滿足業務訴求。使用機器學習方法來進行風險管理,特別是基于邏輯回歸的評分卡模型,因其易于解釋、快速迭代、成熟穩定的特征,正逐漸被廣大銀行所采納。在評分卡過程中,分箱是尤為重要的一個環節,分箱能夠提高模型穩定性,提高計算性能,但是如何實現自動分箱,如何將分箱過程最優化一直是機器學習建模中的一個問題。

分箱的主要方法包括:等頻分箱、等寬分箱、自動分箱等,其中,等頻分箱主要是按數據占比進行分箱,如每10%數據作為一箱,等寬分箱主要是按特征最大最小值均分進行分箱,如年齡最大最小跨度為50,每10歲作為一箱,分為5箱,缺點在于弱化了特征取值不同對響應變量的影響。

自動分箱方法中目前廣泛使用的包括基于決策樹的自動化分箱、卡方分箱(Chi-merge),其中基于決策樹的自動化分箱核心思想是基于熵及信息增益,確定使分割前后特征信息增益最大的點,通過不斷對子節點進行分裂,實現自動分箱??ǚ椒窒浜诵乃枷胧腔谔卣骺ǚ街抵祵Ψ诸愡M行逐步合并,迭代達到終止條件。

以上兩類自動分箱方法對迭代終止條件過于敏感,如樹深度、最小箱容量等,容易造成過擬合問題,同時,兩類自動分箱方法對約束條件支持能力有限(如某類數據必須為一箱,指定箱子區間等),無法完全滿足實際建模過程中的分箱問題需求。

發明內容

本發明的目的在于提供一種對數據自動分箱的方法,以實現快速有效地將數據進行分箱,使得相鄰兩箱之間的關聯度最低,以此達到自動分箱的效果。

為了實現上述目的,本發明實施例采用的技術方案如下:

第一方面,本發明實施例提供了一種對數據自動分箱的方法,所述方法包括:獲取用戶輸入的基本特征數據以及分箱條件;將所述分箱條件帶入預定義函數得到目標函數;根據所述分箱條件確定初始向量,將所述初始向量帶入所述目標函數,確定對所述基本特征數據的搜索方向;以所述初始向量為基準點按照所述搜索方向對所述初始向量進行調整并帶入所述目標函數得到對應的函數值;當后一個函數值與當前函數值的差值小于預設收斂精度,則確定后一個函數值對應的調整后的初始向量作為分割點;依據確定的多個所述分割點對用戶輸入的所述基本特征數據進行分箱。

第二方面,本發明實施例還提供了一種對數據自動分箱的裝置,所述裝置包括:收發模塊,用于獲取用戶輸入的基本特征數據以及分箱條件;處理模塊,用于將所述分箱條件帶入預定義函數得到目標函數;根據所述分箱條件確定初始變量,將所述初始變量帶入所述目標函數,確定對所述基本特征數據的搜索方向;以所述初始向量為基準點按照所述搜索方向對所述初始向量進行調整并帶入所述目標函數得到對應的函數值;當后一個函數值與當前函數值的差值小于預設收斂精度,則確定后一個函數值對應的調整后的初始向量作為分割點;依據確定的多個所述分割點對用戶輸入的所述基本特征數據進行分箱。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于成都四方偉業軟件股份有限公司,未經成都四方偉業軟件股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201910362666.4/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖、流程工藝圖技術構造圖;

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 91精品国产91热久久久做人人| 国产一区在线视频播放| 日韩精品午夜视频| 狠狠色狠狠色综合日日2019| 欧美一区二区三区爽大粗免费| 欧美中文字幕一区二区| 91一区二区三区视频| 国产精品日韩在线观看| 国产在线播放一区二区| 强行挺进女警紧窄湿润| 亚洲精品日日夜夜| 一区二区中文字幕在线| 午夜av资源| 亚洲国产欧美一区| 欧美日韩一区二区三区在线播放 | 国产91麻豆视频| 精品国产一二区| 亚洲自拍偷拍一区二区三区| 日韩欧美一区精品| 国产美女视频一区二区三区| 久久国产精彩视频| 一区二区三区免费高清视频| 精品国产乱码一区二区三区在线| 97国产精品久久| 国产精品不卡一区二区三区| 国产一区激情| 91精品一区在线观看| 日韩欧美视频一区二区| av不卡一区二区三区| 久久精品国产96| 国产一区不卡视频| 电影午夜精品一区二区三区| 欧美激情片一区二区| 国产高清在线精品一区二区三区| 国产精品美女久久久免费| 国产视频一区二区三区四区| 国产一区二区国产| 91精品福利观看| 精品国产一区二区三区高潮视| 最新国产一区二区| 麻豆视频免费播放| 亚洲精品日本无v一区| 国产农村妇女精品一区二区| 国产视频一区二区三区四区| 久久人人97超碰婷婷开心情五月| 午夜一级电影| 国产乱码精品一区二区三区介绍| 欧美日韩一区电影| 久久久中精品2020中文 | 久久99中文字幕| 夜夜嗨av一区二区三区中文字幕 | 国产精品视频免费看人鲁| 日韩亚洲欧美一区二区| 亚洲精品www久久久| 国产91电影在线观看| 国产69精品久久久久999小说| 伊人av综合网| 99久久婷婷国产亚洲终合精品| 午夜激情电影在线播放| 久久精品男人的天堂| 精品videossexfreeohdbbw| 狠狠躁夜夜躁| 国产精品视频久久久久| 日本精品在线一区| 欧美日韩一区二区三区不卡| 手机看片国产一区| 欧美一区二区三区日本| 99爱精品在线| 色婷婷精品久久二区二区我来| 日韩av一二三四区| 亚洲精品国产一区二区三区| 99精品小视频| 久久精品二| 欧美久久久一区二区三区| 久久久久亚洲国产精品| 三级视频一区| 狠狠躁日日躁狂躁夜夜躁av| 精品国产一二三四区| 国产69精品久久99不卡解锁版| 国产一卡在线| 午夜性电影| 精品国产乱码久久久久久老虎|