[發明專利]基于組合最優化的自動化分箱算法在審
| 申請號: | 201910404902.4 | 申請日: | 2019-05-16 |
| 公開(公告)號: | CN110084441A | 公開(公告)日: | 2019-08-02 |
| 發明(設計)人: | 孫博;段兆陽;楊森 | 申請(專利權)人: | 杭州排列科技有限公司 |
| 主分類號: | G06Q10/04 | 分類號: | G06Q10/04;G06Q40/02 |
| 代理公司: | 北京君泊知識產權代理有限公司 11496 | 代理人: | 王程遠 |
| 地址: | 311121 浙江省杭州*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 分箱 算法 目標函數 最優結果 最優化 最優化算法 輸出 建模數據 結合應用 目標變量 停止運行 原始變量 約束條件 運算成本 運行成本 運行過程 自動化 優化 | ||
1.基于組合最優化的自動化分箱算法,其特征在于,包括如下步驟:
S1、對建模數據中的原始變量與目標變量相結合應用某種初始分箱結果,例如等距,等頻,或者自定義的初始分箱結果,初始分割點作為優化算法的基礎,進入下一步的組合最優化算法中;
S2、設置組合最優化算法中的約束條件,包括最終分箱箱數,每箱數據樣本量及特殊樣本數等條件;
S3、利用排列組合思想從最終箱數閾值開始,計算滿足此箱數閾值及滿足約束條件的組合結果中是否含有滿足目標函數最優的組合分箱點,若有,則停止運行;否則,進入下一步;
S4、再次利用組合思想從箱數閾值-1時開始,計算滿足箱數閾值-1并滿足約束條件的組合結果中尋找目標函數最優的組合分箱點,若有,則停止運行;否則,繼續循環箱數閾值-2的情況,直到尋找到目標函數達到最優的組合分箱點;
S5、若樣本數據中含有特殊樣本,則將特殊樣本按照特殊樣本最終箱數閾值進行特殊樣本的分箱,分箱結束后將特殊樣本分箱結果與上述S3或S4的分箱結果合并在一起作為最后的結果輸出;若樣本數據中不含有特殊樣本,則直接將上述S3或S4的分箱結果作為最后的結果輸出。
2.根據權利要求1所述的基于組合最優化的自動化分箱算法,其特征在于:所述的組合最優化算法結合了運籌學中的非線性規劃思想以及數學中的排列組合思想,該組合最優化算法的目標函數為:
其中,yi表示第i組箱中響應標簽的數量,yT表示全部樣本中響應標簽的數量,ni表示第i組箱中未響應標簽的數量,nT表示全部樣本中未響應標簽的數量。
3.根據權利要求2所述的基于組合最優化的自動化分箱算法,其特征在于:該組合最優化算法的約束條件為:
其中,brdi表示第i組分箱樣本與第i+1組分箱樣本中的響應標簽占比的差值,G函數為計算分箱組單調性的函數,n表示最終分箱數,nthershlid表示最終分箱數閾值,Si表示第i箱數據樣本量大小,Sthreshold表示每箱樣本量閾值,Special表示特殊樣本值,B函數為計算特殊樣本的箱數的函數,Bthreshold表示特殊樣本最終箱數閾。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州排列科技有限公司,未經杭州排列科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910404902.4/1.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





