[發(fā)明專利]數(shù)據(jù)處理方法、裝置和目標對象風險監(jiān)控方法在審
| 申請?zhí)枺?/td> | 201911173683.X | 申請日: | 2019-11-26 |
| 公開(公告)號: | CN111105144A | 公開(公告)日: | 2020-05-05 |
| 發(fā)明(設(shè)計)人: | 董肖凱;樊帥 | 申請(專利權(quán))人: | 蘇寧金融科技(南京)有限公司 |
| 主分類號: | G06Q10/06 | 分類號: | G06Q10/06;G06N20/00 |
| 代理公司: | 北京市萬慧達律師事務(wù)所 11111 | 代理人: | 劉艷麗 |
| 地址: | 211800 江蘇省南京市江*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 數(shù)據(jù)處理 方法 裝置 目標 對象 風險 監(jiān)控 | ||
本申請涉及一種數(shù)據(jù)處理方法、裝置、計算機設(shè)備和存儲介質(zhì)。該方法包括:獲取目標對象的屬性數(shù)據(jù),屬性數(shù)據(jù)為連續(xù)型數(shù)據(jù);根據(jù)目標預(yù)設(shè)分箱標準對屬性數(shù)據(jù)進行分箱處理,得到多個當前箱體,各個當前箱體包括對應(yīng)的當前離散型數(shù)據(jù);獲取各個當前箱體對應(yīng)的第一閾值和第二閾值;根據(jù)第一閾值和第二閾值對各個當前箱體中的當前離散型數(shù)據(jù)進行更新,得到目標對象對應(yīng)的目標離散型數(shù)據(jù),目標離散型數(shù)據(jù)作為建立目標對象風險監(jiān)控模型的特征向量。此外,還提供了一種目標對象風險監(jiān)控方法、裝置、計算機設(shè)備和存儲介質(zhì)。
技術(shù)領(lǐng)域
本申請涉及計算機技術(shù)領(lǐng)域,特別是涉及一種數(shù)據(jù)處理方法、裝置、計算機設(shè)備和存儲介質(zhì),以及目標對象風險監(jiān)控方法、裝置、計算機設(shè)備和存儲介質(zhì)。
背景技術(shù)
隨著計算機技術(shù)的發(fā)展,出現(xiàn)了機器學(xué)習(xí)技術(shù),機器學(xué)習(xí)在人工智能領(lǐng)域起到至關(guān)重要的作用,而特征工程是機器學(xué)習(xí)中最重要的步驟,也是機器學(xué)習(xí)模型建立的必要前提,其中,風險監(jiān)控模型是機器學(xué)習(xí)模型中的一種,然而在建立風險監(jiān)控模型時,需要對連續(xù)型變量進行離散化處理,離散化處理后的特征能夠降低模擬過擬合的風險,提高風險監(jiān)控模型的穩(wěn)定性。其中,目前典型的連續(xù)型變量的離散化處理是分箱處理,得到分箱后的箱體,但是由于分箱得到的箱體過多以及箱體內(nèi)的離散型數(shù)據(jù)數(shù)目過多,導(dǎo)致連續(xù)型變量離散化處理不準確,進一步造成后續(xù)風險監(jiān)控模型出現(xiàn)過擬合現(xiàn)象,因此造成風險監(jiān)控模型輸出的風險監(jiān)控結(jié)果不準確。
發(fā)明內(nèi)容
基于此,有必要針對上述技術(shù)問題,提供一種能夠提高離散處理的準確性從而提高風險監(jiān)控模型的準確率的數(shù)據(jù)處理方法、裝置、計算機設(shè)備和存儲介質(zhì),以及目標對象風險監(jiān)控方法、裝置、計算機設(shè)備和存儲介質(zhì)。
一種數(shù)據(jù)處理方法,該方法包括:
獲取目標對象的屬性數(shù)據(jù),屬性數(shù)據(jù)為連續(xù)型數(shù)據(jù);
根據(jù)目標預(yù)設(shè)分箱標準對屬性數(shù)據(jù)進行分箱處理,得到多個當前箱體,各個當前箱體包括對應(yīng)的當前離散型數(shù)據(jù);
獲取各個當前箱體對應(yīng)的第一閾值和第二閾值;
根據(jù)第一閾值和第二閾值對各個當前箱體中的當前離散型數(shù)據(jù)進行更新,得到目標對象對應(yīng)的目標離散型數(shù)據(jù),目標離散型數(shù)據(jù)作為建立目標對象風險監(jiān)控模型的特征向量。
一種數(shù)據(jù)處理裝置,該裝置包括:
屬性數(shù)據(jù)獲取模塊,用于獲取目標對象的屬性數(shù)據(jù),屬性數(shù)據(jù)為連續(xù)型數(shù)據(jù);
屬性數(shù)據(jù)處理模塊,用于根據(jù)目標預(yù)設(shè)分箱標準對屬性數(shù)據(jù)進行分箱處理,得到多個當前箱體,各個當前箱體包括對應(yīng)的當前離散型數(shù)據(jù);
權(quán)重因子獲取模塊,用于獲取各個當前箱體對應(yīng)的第一閾值和第二閾值;
離散型數(shù)據(jù)生成模塊,用于根據(jù)第一閾值和第二閾值對各個當前箱體中的當前離散型數(shù)據(jù)進行更新,得到目標對象對應(yīng)的目標離散型數(shù)據(jù),目標離散型數(shù)據(jù)作為建立目標對象風險監(jiān)控模型的特征向量。
一種計算機設(shè)備,包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,所述處理器執(zhí)行所述計算機程序時實現(xiàn)以下步驟:
獲取目標對象的屬性數(shù)據(jù),屬性數(shù)據(jù)為連續(xù)型數(shù)據(jù);
根據(jù)目標預(yù)設(shè)分箱標準對屬性數(shù)據(jù)進行分箱處理,得到多個當前箱體,各個當前箱體包括對應(yīng)的當前離散型數(shù)據(jù);
獲取各個當前箱體對應(yīng)的第一閾值和第二閾值;
根據(jù)第一閾值和第二閾值對各個當前箱體中的當前離散型數(shù)據(jù)進行更新,得到目標對象對應(yīng)的目標離散型數(shù)據(jù),目標離散型數(shù)據(jù)作為建立目標對象風險監(jiān)控模型的特征向量。
一種計算機可讀存儲介質(zhì),其上存儲有計算機程序,所述計算機程序被處理器執(zhí)行時實現(xiàn)以下步驟:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于蘇寧金融科技(南京)有限公司,未經(jīng)蘇寧金融科技(南京)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911173683.X/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測目的的數(shù)據(jù)處理系統(tǒng)或方法;其他類目不包含的專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測目的的處理系統(tǒng)或方法
G06Q10-00 行政;管理
G06Q10-02 .預(yù)定,例如用于門票、服務(wù)或事件的
G06Q10-04 .預(yù)測或優(yōu)化,例如線性規(guī)劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規(guī)劃、調(diào)度或分配時間、人員或機器資源;企業(yè)規(guī)劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理
- 數(shù)據(jù)處理設(shè)備,數(shù)據(jù)處理方法,和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理電路、數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法、數(shù)據(jù)處理控制方法
- 數(shù)據(jù)處理設(shè)備、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法及數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法及計算機可讀取的記錄介質(zhì)
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法以及數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法以及數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序





