[發(fā)明專利]一種卡方分箱方法和裝置在審
| 申請?zhí)枺?/td> | 202111320379.0 | 申請日: | 2021-11-09 |
| 公開(公告)號: | CN114049195A | 公開(公告)日: | 2022-02-15 |
| 發(fā)明(設(shè)計(jì))人: | 陳翱 | 申請(專利權(quán))人: | 上海旭榮網(wǎng)絡(luò)科技有限公司 |
| 主分類號: | G06Q40/02 | 分類號: | G06Q40/02 |
| 代理公司: | 上海領(lǐng)譽(yù)知識產(chǎn)權(quán)代理有限公司 31383 | 代理人: | 王琰 |
| 地址: | 201899 上海市嘉定區(qū)*** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 卡方分箱 方法 裝置 | ||
1.一種卡方分箱方法,其特征在于,包括:
對原始數(shù)據(jù)進(jìn)行零值分箱,得到第一分箱結(jié)果,其中,所述零值分箱用于指示將同一類別的數(shù)量為零的相鄰的兩個箱子合并為一個箱子;
基于所述第一分箱結(jié)果進(jìn)行相鄰箱子的卡方檢驗(yàn),得到第二分箱結(jié)果;
對所述第二分箱結(jié)果進(jìn)行WOE值單調(diào)性檢驗(yàn);
若所述第二分箱結(jié)果的WOE值滿足單調(diào)性條件,則將所述第二分箱結(jié)果確定為候選分箱結(jié)果。
2.根據(jù)權(quán)利要求1所述的卡方分箱方法,其特征在于,基于所述第一分箱結(jié)果進(jìn)行相鄰箱子的卡方檢驗(yàn),得到第二分箱結(jié)果,包括:
基于所述第一分箱結(jié)果重復(fù)執(zhí)行以下步驟:
判斷當(dāng)前分箱結(jié)果對應(yīng)的P值是否不超過第一閾值、且當(dāng)前分箱結(jié)果中箱子數(shù)量是否不超過第二閾值;
若當(dāng)前分箱結(jié)果對應(yīng)的P值超過所述第一閾值、和/或當(dāng)前分箱結(jié)果中箱子數(shù)量超過所述第二閾值,則將卡方值最小的相鄰箱子進(jìn)行合并,得到第三分箱結(jié)果,并將所述第三分箱結(jié)果作為當(dāng)前分箱結(jié)果;
若當(dāng)前分箱結(jié)果對應(yīng)的P值不超過所述第一閾值、且當(dāng)前分箱結(jié)果中箱子數(shù)量不超過所述第二閾值,則將當(dāng)前分箱結(jié)果作為所述第二分箱結(jié)果。
3.根據(jù)權(quán)利要求1或2所述的卡方分箱方法,其特征在于,在將所述第二分箱結(jié)果確定為候選分箱結(jié)果之后,所述方法還包括:
判斷所述候選分箱結(jié)果中箱子數(shù)量是否為第三閾值;
若所述候選分箱結(jié)果中箱子數(shù)量為所述第三閾值,則確定所述候選分箱結(jié)果為最終分箱結(jié)果。
4.根據(jù)權(quán)利要求3所述的卡方分箱方法,其特征在于,在判斷所述候選分箱結(jié)果中箱子數(shù)量是否為目標(biāo)閾值之后,所述方法還包括:
若所述候選分箱結(jié)果中箱子數(shù)量小于所述第三閾值,則將所述候選分箱結(jié)果中IV值最大的候選分箱結(jié)果確定為最終分箱結(jié)果。
5.一種卡方分箱裝置,其特征在于,包括:
零值分箱單元,用于對原始數(shù)據(jù)進(jìn)行零值分箱,得到第一分箱結(jié)果,其中,所述零值分箱用于指示將同一類別的數(shù)量為零的相鄰的兩個箱子合并為一個箱子;
卡方檢驗(yàn)單元,用于基于所述第一分箱結(jié)果進(jìn)行相鄰箱子的卡方檢驗(yàn),得到第二分箱結(jié)果;
單調(diào)性檢驗(yàn)單元,用于對所述第二分箱結(jié)果進(jìn)行WOE值單調(diào)性檢驗(yàn);
第一確定單元,用于若所述第二分箱結(jié)果的WOE值滿足單調(diào)性條件,則將所述第二分箱結(jié)果確定為候選分箱結(jié)果。
6.根據(jù)權(quán)利要求5所述的卡方分箱裝置,其特征在于,所述卡方檢驗(yàn)單元用于:
基于所述第一分箱結(jié)果重復(fù)執(zhí)行以下步驟:
判斷當(dāng)前分箱結(jié)果對應(yīng)的P值是否不超過第一閾值、且當(dāng)前分箱結(jié)果中箱子數(shù)量是否不超過第二閾值;
若當(dāng)前分箱結(jié)果對應(yīng)的P值超過所述第一閾值、和/或當(dāng)前分箱結(jié)果中箱子數(shù)量超過所述第二閾值,則將卡方值最小的相鄰箱子進(jìn)行合并,得到第三分箱結(jié)果,并將所述第三分箱結(jié)果作為當(dāng)前分箱結(jié)果;
若當(dāng)前分箱結(jié)果對應(yīng)的P值不超過所述第一閾值、且當(dāng)前分箱結(jié)果中箱子數(shù)量不超過所述第二閾值,則將當(dāng)前分箱結(jié)果作為所述第二分箱結(jié)果。
7.根據(jù)權(quán)利要求5或6所述的卡方分箱裝置,其特征在于,所述裝置還包括:
判斷單元,用于在將所述第二分箱結(jié)果確定為候選分箱結(jié)果之后,判斷所述候選分箱結(jié)果中箱子數(shù)量是否為第三閾值;
第二確定單元,用于若所述候選分箱結(jié)果中箱子數(shù)量為所述第三閾值,則確定所述候選分箱結(jié)果為最終分箱結(jié)果。
8.根據(jù)權(quán)利要求7所述的卡方分箱裝置,其特征在于,所述裝置還包括:
第三確定單元,用于在判斷所述候選分箱結(jié)果中箱子數(shù)量是否為目標(biāo)閾值之后,若所述候選分箱結(jié)果中箱子數(shù)量小于所述第三閾值,則將所述候選分箱結(jié)果中IV值最大的候選分箱結(jié)果確定為最終分箱結(jié)果。
9.一種計(jì)算機(jī)設(shè)備,包括存儲器、處理器以及存儲在所述存儲器上并可在所述處理器上運(yùn)行的計(jì)算機(jī)程序,其特征在于,所述處理器執(zhí)行所述計(jì)算機(jī)程序時實(shí)現(xiàn)如權(quán)利要求1至4中任一項(xiàng)所述的卡方分箱方法。
10.一種計(jì)算機(jī)可讀存儲介質(zhì),其上存儲有計(jì)算機(jī)程序,其特征在于,該程序被處理器執(zhí)行時實(shí)現(xiàn)如權(quán)利要求1至4中任一項(xiàng)所述的卡方分箱方法。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海旭榮網(wǎng)絡(luò)科技有限公司,未經(jīng)上海旭榮網(wǎng)絡(luò)科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111320379.0/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測目的的數(shù)據(jù)處理系統(tǒng)或方法;其他類目不包含的專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測目的的處理系統(tǒng)或方法
G06Q40-00 金融;保險;稅務(wù)策略;公司或所得稅的處理
G06Q40-02 .銀行業(yè),例如,利息計(jì)算、信貸審批、抵押、家庭銀行或網(wǎng)上銀行
G06Q40-04 .交易,例如,股票、商品、金融衍生工具或貨幣兌換
G06Q40-06 .投資,例如,金融工具、資產(chǎn)組合管理或者基金管理
G06Q40-08 .保險,例如,風(fēng)險分析或養(yǎng)老金
- 配電箱
- 評分卡模型的建立方法、裝置、計(jì)算機(jī)設(shè)備和存儲介質(zhì)
- 數(shù)據(jù)挖掘方法、裝置、計(jì)算機(jī)設(shè)備及計(jì)算機(jī)可讀存儲介質(zhì)
- 用戶智能化分層方法、裝置、電子設(shè)備及可讀存儲介質(zhì)
- 一種基于第三方數(shù)據(jù)的消費(fèi)金融信用評分卡開發(fā)方法
- 特征值分箱方法、系統(tǒng)及裝置
- 銀行業(yè)務(wù)數(shù)據(jù)的分箱方法及系統(tǒng)
- 一種嵌入平滑參數(shù)的信用風(fēng)險評分方法
- 對特征序列進(jìn)行分箱的方法、裝置及計(jì)算機(jī)可讀存儲介質(zhì)
- 一種數(shù)據(jù)處理方法、裝置和用于數(shù)據(jù)處理的裝置





