[發(fā)明專利]數(shù)據(jù)價(jià)值評(píng)估方法、終端、裝置及可讀存儲(chǔ)介質(zhì)在審
| 申請(qǐng)?zhí)枺?/td> | 201910919193.3 | 申請(qǐng)日: | 2019-09-26 |
| 公開(公告)號(hào): | CN110674994A | 公開(公告)日: | 2020-01-10 |
| 發(fā)明(設(shè)計(jì))人: | 陳瑞欽;黃啟軍;林冰垠;李詩(shī)琦;唐興興 | 申請(qǐng)(專利權(quán))人: | 深圳前海微眾銀行股份有限公司 |
| 主分類號(hào): | G06Q10/04 | 分類號(hào): | G06Q10/04;G06F16/28;G06F16/35 |
| 代理公司: | 44287 深圳市世紀(jì)恒程知識(shí)產(chǎn)權(quán)代理事務(wù)所 | 代理人: | 王韜 |
| 地址: | 518000 廣東省深圳市前海深港合作區(qū)前*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 異常數(shù)據(jù) 特征數(shù)據(jù) 數(shù)據(jù)集 樣本集 評(píng)估 價(jià)值評(píng)估 預(yù)測(cè)目標(biāo) 計(jì)算異常數(shù)據(jù) 可讀存儲(chǔ)介質(zhì) 評(píng)估結(jié)果 預(yù)測(cè)模型 原始目標(biāo) 預(yù)設(shè) 樣本 終端 | ||
本發(fā)明公開了一種數(shù)據(jù)價(jià)值評(píng)估方法,包括以下步驟:基于所述特征數(shù)據(jù)集以及預(yù)測(cè)模型生成所述特征數(shù)據(jù)集對(duì)應(yīng)的預(yù)測(cè)目標(biāo)數(shù)據(jù)集,而后基于所述原始目標(biāo)數(shù)據(jù)集以及所述預(yù)測(cè)目標(biāo)數(shù)據(jù)集,確定所述特征數(shù)據(jù)集中的異常數(shù)據(jù)以及所述異常數(shù)據(jù)對(duì)應(yīng)的數(shù)據(jù)價(jià)值,接下來基于所述異常數(shù)據(jù)對(duì)應(yīng)的數(shù)據(jù)價(jià)值以及預(yù)設(shè)價(jià)值,確定所述待評(píng)估樣本集的評(píng)估結(jié)果。本發(fā)明還公開了一種裝置、終端及可讀存儲(chǔ)介質(zhì)。通過確定待評(píng)估樣本集中的異常數(shù)據(jù),并計(jì)算異常數(shù)據(jù)對(duì)應(yīng)的數(shù)據(jù)價(jià)值,進(jìn)而確定待評(píng)估樣本集對(duì)應(yīng)的平均價(jià)值,實(shí)現(xiàn)了對(duì)待評(píng)估樣本集的價(jià)值評(píng)估。
技術(shù)領(lǐng)域
本發(fā)明涉及終端技術(shù)領(lǐng)域,尤其涉及一種數(shù)據(jù)價(jià)值評(píng)估方法、終端、裝置及可讀存儲(chǔ)介質(zhì)。
背景技術(shù)
當(dāng)前越來越多的領(lǐng)域開始使用機(jī)器學(xué)習(xí)技術(shù),機(jī)器學(xué)習(xí)模型的準(zhǔn)確性和魯棒性至關(guān)重要,這需要大量?jī)?yōu)質(zhì)數(shù)據(jù)集進(jìn)行訓(xùn)練。
機(jī)器學(xué)習(xí)模型依賴數(shù)據(jù)訓(xùn)練而成,優(yōu)質(zhì)的數(shù)據(jù)是保證模型訓(xùn)練成功最重要的基礎(chǔ)。模型生成之后仍需要不斷地更新以提升模型性能,這也依賴于大量?jī)?yōu)質(zhì)訓(xùn)練數(shù)據(jù)的輸入。尤其是通過第三方提供的訓(xùn)練數(shù)據(jù)集對(duì)模型進(jìn)行更新訓(xùn)練,如果訓(xùn)練數(shù)據(jù)集質(zhì)量不高,會(huì)導(dǎo)致模型的準(zhǔn)確性降低,魯棒性減弱。目前,對(duì)訓(xùn)練數(shù)據(jù)集進(jìn)行價(jià)值評(píng)估沒有統(tǒng)一的標(biāo)準(zhǔn)或方法。
發(fā)明內(nèi)容
本發(fā)明的主要目的在于提供一種數(shù)據(jù)價(jià)值評(píng)估方法、終端、裝置及可讀存儲(chǔ)介質(zhì),旨在解決現(xiàn)有因訓(xùn)練數(shù)據(jù)集質(zhì)量不高,在利用訓(xùn)練數(shù)據(jù)集訓(xùn)練模型后,導(dǎo)致模型的準(zhǔn)確性降低,魯棒性減弱的技術(shù)問題。
為實(shí)現(xiàn)上述目的,本發(fā)明提供一種數(shù)據(jù)價(jià)值評(píng)估方法,所述的數(shù)據(jù)價(jià)值評(píng)估方法包括以下步驟:
基于所述特征數(shù)據(jù)集以及預(yù)測(cè)模型生成所述特征數(shù)據(jù)集對(duì)應(yīng)的預(yù)測(cè)目標(biāo)數(shù)據(jù)集;
基于所述原始目標(biāo)數(shù)據(jù)集以及所述預(yù)測(cè)目標(biāo)數(shù)據(jù)集,確定所述特征數(shù)據(jù)集中的異常數(shù)據(jù)以及所述異常數(shù)據(jù)對(duì)應(yīng)的數(shù)據(jù)價(jià)值;
基于所述異常數(shù)據(jù)對(duì)應(yīng)的數(shù)據(jù)價(jià)值以及預(yù)設(shè)價(jià)值,確定所述待評(píng)估樣本集的評(píng)估結(jié)果。
進(jìn)一步地,在一實(shí)施方式中,所述特征數(shù)據(jù)集包括多個(gè)子數(shù)據(jù),所述基于所述原始目標(biāo)數(shù)據(jù)集以及所述預(yù)測(cè)目標(biāo)數(shù)據(jù)集,確定所述特征數(shù)據(jù)集中的異常數(shù)據(jù)以及所述異常數(shù)據(jù)對(duì)應(yīng)的數(shù)據(jù)價(jià)值的步驟包括:
基于所述原始目標(biāo)數(shù)據(jù)集獲取子數(shù)據(jù)對(duì)應(yīng)的第一目標(biāo)值,基于所述預(yù)測(cè)目標(biāo)數(shù)據(jù)集獲取所述子數(shù)據(jù)對(duì)應(yīng)的第一預(yù)測(cè)值;
在所述第一目標(biāo)值與所述第一預(yù)測(cè)值不匹配時(shí),確定所述子數(shù)據(jù)為異常數(shù)據(jù);
基于所述原始目標(biāo)數(shù)據(jù)集以及所述預(yù)測(cè)目標(biāo)數(shù)據(jù)集確定所述異常數(shù)據(jù)對(duì)應(yīng)的數(shù)據(jù)價(jià)值。
進(jìn)一步地,在一實(shí)施方式中,所述預(yù)測(cè)模型是分類模型,所述預(yù)測(cè)目標(biāo)數(shù)據(jù)集包括預(yù)測(cè)值和預(yù)測(cè)值對(duì)應(yīng)的預(yù)測(cè)概率,所述基于所述原始目標(biāo)數(shù)據(jù)集以及所述預(yù)測(cè)目標(biāo)數(shù)據(jù)集確定所述異常數(shù)據(jù)對(duì)應(yīng)的數(shù)據(jù)價(jià)值的步驟包括:
基于所述預(yù)測(cè)目標(biāo)數(shù)據(jù)集獲取所述異常數(shù)據(jù)對(duì)應(yīng)的預(yù)測(cè)概率,并基于所述異常數(shù)據(jù)對(duì)應(yīng)的預(yù)測(cè)概率確定所述異常數(shù)據(jù)對(duì)應(yīng)的數(shù)據(jù)價(jià)值。
進(jìn)一步地,在一實(shí)施方式中,所述預(yù)測(cè)模型是回歸模型,所述預(yù)測(cè)目標(biāo)數(shù)據(jù)集包括預(yù)測(cè)值,所述基于所述原始目標(biāo)數(shù)據(jù)集以及所述預(yù)測(cè)目標(biāo)數(shù)據(jù)集確定所述異常數(shù)據(jù)對(duì)應(yīng)的數(shù)據(jù)價(jià)值的步驟包括:
基于所述原始目標(biāo)數(shù)據(jù)集獲取所述異常數(shù)據(jù)對(duì)應(yīng)的第二目標(biāo)值,基于所述預(yù)測(cè)目標(biāo)數(shù)據(jù)集獲取所述異常數(shù)據(jù)對(duì)應(yīng)的第二預(yù)測(cè)值,將所述第二目標(biāo)值和所述第二預(yù)測(cè)值相減并求絕對(duì)值,得到所述異常數(shù)據(jù)對(duì)應(yīng)的預(yù)測(cè)誤差;
基于所述預(yù)測(cè)誤差以及所述第二目標(biāo)值確定所述異常數(shù)據(jù)對(duì)應(yīng)的數(shù)據(jù)價(jià)值。
進(jìn)一步地,在一實(shí)施方式中,所述異常數(shù)據(jù)包括多個(gè),所述基于所述異常數(shù)據(jù)對(duì)應(yīng)的數(shù)據(jù)價(jià)值以及預(yù)設(shè)價(jià)值,確定所述待評(píng)估樣本集的評(píng)估結(jié)果的步驟包括:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于深圳前海微眾銀行股份有限公司,未經(jīng)深圳前海微眾銀行股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910919193.3/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測(cè)目的的數(shù)據(jù)處理系統(tǒng)或方法;其他類目不包含的專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測(cè)目的的處理系統(tǒng)或方法
G06Q10-00 行政;管理
G06Q10-02 .預(yù)定,例如用于門票、服務(wù)或事件的
G06Q10-04 .預(yù)測(cè)或優(yōu)化,例如線性規(guī)劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項(xiàng)目管理,例如組織、規(guī)劃、調(diào)度或分配時(shí)間、人員或機(jī)器資源;企業(yè)規(guī)劃;組織模型
G06Q10-08 .物流,例如倉(cāng)儲(chǔ)、裝貨、配送或運(yùn)輸;存貨或庫(kù)存管理,例如訂貨、采購(gòu)或平衡訂單
G06Q10-10 .辦公自動(dòng)化,例如電子郵件或群件的計(jì)算機(jī)輔助管理
- 一種面向基礎(chǔ)地理信息異常數(shù)據(jù)的挖掘方法
- 一種微電阻率掃描成像測(cè)井?dāng)?shù)據(jù)異常校正方法及裝置
- 一種Flash播放器異常日志管理方法及系統(tǒng)
- 一種異常數(shù)據(jù)指標(biāo)分析的方法及裝置
- 數(shù)據(jù)回收方法、裝置、存儲(chǔ)介質(zhì)及電子設(shè)備
- 一種網(wǎng)絡(luò)流量數(shù)據(jù)分析方法及系統(tǒng)
- 異常數(shù)據(jù)的分析方法及異常數(shù)據(jù)分析平臺(tái)
- 一種基于電子圍網(wǎng)的異常數(shù)據(jù)優(yōu)化方法、裝置及電子設(shè)備
- 一種異常導(dǎo)入數(shù)據(jù)的處理方法、裝置及設(shè)備
- 管網(wǎng)檢測(cè)數(shù)據(jù)異常判斷方法及系統(tǒng)
- 會(huì)員特征數(shù)據(jù)統(tǒng)計(jì)方法及特征數(shù)據(jù)統(tǒng)計(jì)系統(tǒng)
- 人臉特征數(shù)據(jù)獲取系統(tǒng)
- 生物特征數(shù)據(jù)檢測(cè)裝置
- 學(xué)生特征數(shù)據(jù)挖掘系統(tǒng)
- 學(xué)生特征數(shù)據(jù)挖掘系統(tǒng)
- 時(shí)間序列數(shù)據(jù)特征量提取裝置、時(shí)間序列數(shù)據(jù)特征量提取方法和時(shí)間序列數(shù)據(jù)特征量提取程序
- 特征數(shù)據(jù)庫(kù)的更新、數(shù)據(jù)特征的確定方法、裝置及設(shè)備
- 生理特征數(shù)據(jù)測(cè)量裝置
- 特征大數(shù)據(jù)提取裝置
- 數(shù)據(jù)特征處理方法及數(shù)據(jù)特征處理裝置
- 數(shù)據(jù)集及數(shù)據(jù)集“異或”的DMA傳送
- 數(shù)據(jù)處理的方法和系統(tǒng)
- 鏈接數(shù)據(jù)集
- 數(shù)據(jù)處理方法及其設(shè)備
- VR視頻轉(zhuǎn)碼方法及裝置
- 數(shù)據(jù)匹配方法以及裝置
- 一種非平衡數(shù)據(jù)集的分類方法
- 處理數(shù)據(jù)的方法、裝置、電子設(shè)備及可讀存儲(chǔ)介質(zhì)
- 基于數(shù)據(jù)傾斜的關(guān)聯(lián)查詢方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種實(shí)體識(shí)別模型的建立方法、系統(tǒng)、電子設(shè)備及介質(zhì)
- 一種用于人臉檢測(cè)的訓(xùn)練樣本的生成方法及裝置
- 在文本中確定語義關(guān)鍵詞的方法和裝置
- 基于主成分分布函數(shù)的軟件缺陷預(yù)測(cè)不平衡數(shù)據(jù)處理方法
- 增益形狀電路的按比例縮放
- 基于核極限學(xué)習(xí)機(jī)的樣本處理方法及系統(tǒng)
- 一種反洗錢模型的訓(xùn)練方法及裝置
- 一種分類模型訓(xùn)練方法及計(jì)算機(jī)設(shè)備
- 訓(xùn)練樣本集生成方法、深度生成模型的訓(xùn)練方法和裝置
- 分類器訓(xùn)練方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 偽造樣本檢測(cè)模型的訓(xùn)練方法、偽造樣本識(shí)別方法、裝置、介質(zhì)和設(shè)備





