[發明專利]一種變量分組方法及相關設備在審
| 申請號: | 201910583362.0 | 申請日: | 2019-06-28 |
| 公開(公告)號: | CN112148706A | 公開(公告)日: | 2020-12-29 |
| 發明(設計)人: | 張焯 | 申請(專利權)人: | 重慶小雨點小額貸款有限公司 |
| 主分類號: | G06F16/21 | 分類號: | G06F16/21;G06F16/22;G06F16/2458 |
| 代理公司: | 廣州三環專利商標代理有限公司 44202 | 代理人: | 郝傳鑫;熊永強 |
| 地址: | 401120 重*** | 國省代碼: | 重慶;50 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 變量 分組 方法 相關 設備 | ||
1.一種變量分組方法,其特征在于,所述方法包括:
將變量對應的多個取值依照預設順序排列,并根據每個取值的排列順序創建所述每個取值對應的索引;
依照預設劃分規則將第一索引至第n索引之間的索引區域劃分為至少一種區域組,每種區域組表征了對所述索引區域的一種劃分方式,所述每種區域組包括至少兩個區域,所述第一索引對應取值的排列順序為1,所述第n索引對應取值的排列順序為n,所述n為大于或者等于1的整數;
確定所述變量在所述每種區域組下的皮爾森卡方統計量,并從所述至少一種區域組中確定出皮爾森卡方統計量最大的目標區域組;
基于所述目標區域組對所述變量進行分組。
2.根據權利要求1所述的方法,其特征在于,所述依照預設劃分規則將第一索引至第n索引之間的索引區域劃分為至少一種區域組,包括:
依照預設劃分規則對第一索引至第n索引之間的索引區域進行遞歸分割,得到至少一種區域組。
3.根據權利要求2所述的方法其特征在于,所述確定所述變量在所述每種區域組下的皮爾森卡方統計量,包括:
獲取預先存儲的所述變量在第一區域組下各個區域的皮爾森卡方統計量,所述第一區域組是所述至少一種區域組中的任一種,各個區域對應的樣本量大于或等于預設樣本量閾值;
對所述各個區域的皮爾森卡方統計量進行求和,并將求和結果確定為所述變量在所述第一區域組下的皮爾森卡方統計量。
4.根據權利要求3所述的方法,其特征在于,所述獲取預先存儲的所述變量在第一區域組下各個區域的皮爾森卡方統計量之前,所述方法還包括:
基于所述預設樣本量閾值對所述第一索引至第n索引之間的索引區域進行劃分,得到所述索引區域對應的至少兩個子區域,每個子區域對應的樣本量大于或者等于所述預設樣本量閾值;
計算所述變量在各個子區域下的皮爾森卡方統計量,并將各個子區域與對應的皮爾森卡方統計量關聯存儲;
其中,所述獲取預先存儲的所述變量在第一區域組下各個區域的皮爾森卡方統計量,包括:
從預先存儲的所述各個子區域中確定與第一區域組的各個區域匹配的目標子區域,并將與各個目標子區域關聯存儲的皮爾森卡方統計量確定為所述變量在所述第一區域組下各個區域的皮爾森卡方統計量。
5.根據權利要求1所述的方法,其特征在于,所述從所述至少一種區域組中確定出皮爾森卡方統計量最大的目標區域組之后,所述方法還包括:
將所述目標區域組對應的皮爾森卡方統計量確定為所述第一索引至第n索引之間的索引區域的目標皮爾森卡方統計量;
依照預設索引結構創建所述第一索引至第n索引之間的索引區域的目標皮爾森卡方統計量對應的皮爾森卡方統計量索引;
將所述目標皮爾森卡方統計量與所述皮爾森卡方統計量索引關聯存儲至預設存儲區域。
6.根據權利要求1所述的方法,其特征在于,所述依照預設劃分規則將第一索引至第n索引之間的索引區域劃分為至少一種區域組,包括:
獲取用戶從至少一個單調模式中選擇的目標單調模式;
從至少一個預設劃分規則中獲取與所述目標單調模式匹配的目標預設劃分規則;
基于所述目標預設劃分規則將第一索引至第n索引之間的索引區域劃分為至少一種區域。
7.根據權利要求1所述的方法,其特征在于,所述將變量對應的多個取值依照預設順序排列之前,所述方法還包括:
獲取所有樣本數據中所述變量的取值;
若存在目標樣本數據的所述變量的取值缺失,則將所述目標樣本數據的所述變量設置為一個小于或者等于預設負數閾值的取值;
若不存在目標樣本數據的所述變量的取值缺失,則觸發執行所述將變量對應的多個取值依照預設順序排列的步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于重慶小雨點小額貸款有限公司,未經重慶小雨點小額貸款有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910583362.0/1.html,轉載請聲明來源鉆瓜專利網。





