[發(fā)明專利]一種模型自動更新方法、裝置、系統(tǒng)及電子設(shè)備在審
| 申請?zhí)枺?/td> | 202110193968.0 | 申請日: | 2021-02-20 |
| 公開(公告)號: | CN113011596A | 公開(公告)日: | 2021-06-22 |
| 發(fā)明(設(shè)計)人: | 劉珊珊;韋云健 | 申請(專利權(quán))人: | 陽光保險集團股份有限公司 |
| 主分類號: | G06N20/00 | 分類號: | G06N20/00;G06K9/62 |
| 代理公司: | 北京超凡宏宇專利代理事務(wù)所(特殊普通合伙) 11463 | 代理人: | 武慧南 |
| 地址: | 518000 廣東省深圳市福田*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 模型 自動更新 方法 裝置 系統(tǒng) 電子設(shè)備 | ||
本申請公開了一種模型自動更新方法、裝置、系統(tǒng)及電子設(shè)備,該方法包括:基于第一預(yù)定時間段內(nèi)的第一時序數(shù)據(jù)的多個初始特征,構(gòu)建初始模型;判斷所構(gòu)建的初始模型的模型評價指標(biāo)是否滿足預(yù)定要求;如果初始模型的模型評價指標(biāo)滿足預(yù)定要求,則獲取第二預(yù)定時間段內(nèi)的第二時序數(shù)據(jù);確定所獲取的第二時序數(shù)據(jù)的多個更新特征;基于多個更新特征對初始模型進行更新。通過采用上述模型自動更新方法、裝置、系統(tǒng)及電子設(shè)備,解決了在時間跨度較長的情況下,因特征分布發(fā)生變化而導(dǎo)致模型預(yù)測準(zhǔn)確度降低的問題。
技術(shù)領(lǐng)域
本申請涉及大數(shù)據(jù)技術(shù)領(lǐng)域,尤其是涉及一種模型自動更新方法、裝置、系統(tǒng)及電子設(shè)備。
背景技術(shù)
隨著大數(shù)據(jù)技術(shù)的不斷發(fā)展,機器學(xué)習(xí)模型已經(jīng)被廣泛應(yīng)用于各行業(yè)中。全面了解數(shù)據(jù)的概況以及探查各個變量的特征是構(gòu)建機器學(xué)習(xí)模型的重要環(huán)節(jié),在機器學(xué)習(xí)任務(wù)中特征的選取通常決定了模型效果的上限,好的特征選擇,不僅能夠防止維度災(zāi)難、減少訓(xùn)練時間,更能夠增強模型泛化能力,減少過擬合。因此,優(yōu)化特征變量的選擇對構(gòu)建機器學(xué)習(xí)模型具有重要的意義。在很多業(yè)務(wù)場景中,由于機器學(xué)習(xí)模型所使用的數(shù)據(jù)量有限,因此通常需要選取時間跨度在兩年以上的數(shù)據(jù)。然而隨著時間的推移,新的樣本數(shù)據(jù)與構(gòu)建模型時所使用的樣本數(shù)據(jù)相比發(fā)生了較大的變化,這導(dǎo)致了模型預(yù)測效果會逐漸變差,因此需要定期更新模型。現(xiàn)有技術(shù)中,通常采用將新選取的樣本數(shù)據(jù)直接輸入到模型的方式更新模型。
上述現(xiàn)有的模型更新方法中,更新后的模型仍采用構(gòu)建模型時所使用的特征變量,但構(gòu)建模型時所使用的特征變量已不適用于新的樣本數(shù)據(jù),這就導(dǎo)致了更新后的模型預(yù)測結(jié)果不準(zhǔn)確的問題。
發(fā)明內(nèi)容
有鑒于此,本申請?zhí)峁┮环N模型自動更新方法、裝置、系統(tǒng)及電子設(shè)備,其目的是為在對模型進行更新時,選取適用于新樣本數(shù)據(jù)的特征變量,避免了因特征變量不適用于新樣本數(shù)據(jù),而導(dǎo)致更新后的模型預(yù)測結(jié)果不準(zhǔn)確的問題。
第一方面,本申請實施例提供了一種模型自動更新方法,包括:
基于第一預(yù)定時間段內(nèi)的第一時序數(shù)據(jù)的多個初始特征,構(gòu)建初始模型;
判斷所構(gòu)建的初始模型的模型評價指標(biāo)是否滿足預(yù)定要求;
如果初始模型的模型評價指標(biāo)滿足預(yù)定要求,則獲取第二預(yù)定時間段內(nèi)的第二時序數(shù)據(jù);
確定所獲取的第二時序數(shù)據(jù)的多個更新特征;
基于多個更新特征對初始模型進行更新。
可選地,確定所獲取的第二時序數(shù)據(jù)的多個更新特征,可包括:(A)確定第二預(yù)定時間段內(nèi)的多個預(yù)設(shè)時間點;(B)針對每個預(yù)設(shè)時間點,確定與該預(yù)設(shè)時間點對應(yīng)的樣本集,其中,樣本集包括將第二時序數(shù)據(jù)按照該預(yù)設(shè)時間點劃分所得到的處于該預(yù)設(shè)時間點之前的訓(xùn)練數(shù)據(jù)和處于該預(yù)設(shè)時間點之后的測試數(shù)據(jù);(C)確定第二時序數(shù)據(jù)的多個候選特征組,每個候選特征組中包括至少一個候選特征;(D)針對每個候選特征組,利用所確定的樣本集構(gòu)建針對該候選特征的多個分類器;(E)針對每個候選特征組,確定該候選特征組在每個分類器下的特征評估指標(biāo);(F)基于所確定的特征評估指標(biāo),從多個候選特征組中確定出多個更新特征。
可選地,基于所確定的特征評估指標(biāo),從多個候選特征組中確定出多個更新特征,可包括:(F1)針對每個候選特征組,確定該候選特征組在每個分類器下的特征評估指標(biāo)的統(tǒng)計值;(F2)基于全部的候選特征組對應(yīng)的統(tǒng)計值,從全部的候選特征組中選擇出目標(biāo)候選特征組;(F3)確定目標(biāo)候選特征組中的候選特征的數(shù)量是否達到預(yù)定數(shù)值;(F4)如果目標(biāo)候選特征組中的候選特征的數(shù)量沒有達到預(yù)定數(shù)值,則基于目標(biāo)候選特征組中的候選特征構(gòu)建新候選特征組,用所構(gòu)建的新候選特征組更新候選特征組,并返回執(zhí)行步驟(D);(F5)如果目標(biāo)候選特征組中的候選特征的數(shù)量達到預(yù)定數(shù)值,則將目標(biāo)候選特征組中的候選特征確定為多個更新特征。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于陽光保險集團股份有限公司,未經(jīng)陽光保險集團股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110193968.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種高硼硅玻璃加工檢測系統(tǒng)
- 下一篇:一種防堵塞球閥





