[發明專利]多分類模型自學習在線更新方法、系統及裝置在審
| 申請號: | 202010922752.9 | 申請日: | 2020-09-04 |
| 公開(公告)號: | CN112036579A | 公開(公告)日: | 2020-12-04 |
| 發明(設計)人: | 李弦;阮曉雯;徐亮 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06N20/00 | 分類號: | G06N20/00;G06K9/62 |
| 代理公司: | 北京鴻元知識產權代理有限公司 11327 | 代理人: | 袁文婷;張娓娓 |
| 地址: | 518033 廣東省深圳市福田區福*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 分類 模型 自學習 在線 更新 方法 系統 裝置 | ||
1.一種多分類模型自學習在線更新方法,應用于電子裝置,其特征在于,所述方法包括:
根據預設統計周期對待更新模型的預測性能進行監測統計,并將各統計周期內的預測性能統計結果存入統計數據庫;
使用預設的觸發機制對所述統計數據庫內的數據進行檢查,以判斷所述待更新模型是否需要進行在線更新;
若所述待更新模型需要進行在線更新,則獲取線上新產生數據,并根據所述新產生數據對待更新模型的訓練數據進行更新;
使用更新后訓練數據對所述待更新模型進行更新訓練,以獲得更新后的多分類模型。
2.根據權利要求1所述的多分類模型自學習在線更新方法,其特征在于,所述統計數據庫存儲在區塊鏈的節點中,并且所述預測性能包括預測精度precision值,所述預測精度precision值的計算公式為:
預測精度Precision值=正確分類的樣本數/整體的樣本數;并且,
所述觸發機制包括:
機制A:若包含當前統計周期在內的歷史N個統計周期的預測精度precision值持續下降,則判定所述待更新模型需要進行在線更新,其中,N為第一預設參數。
3.根據權利要求2所述的多分類模型自學習在線更新方法,其特征在于,所述觸發機制還包括:
機制B:若當前統計周期的預測精度Precision值小于預測精度平均值-2*預測精度標準差,或當前統計周期的預測精度Precision值小于預測精度平均值-下降百分比P;則判定所述待更新模型需要進行在線更新;其中,
所述預測精度平均值為歷史N個統計周期的預測精度Precision值的平均值,所述預測精度標準差為歷史N個統計周期的預測精度Precision值的標準差,所述下降百分比P為第二預測參數。
4.根據權利要求3所述的多分類模型自學習在線更新方法,其特征在于,所述觸發機制還包括:
機制C:判定所述待更新模型的上線時長是否達到預設的更新周期閾值,若達到,則判定所述待更新模型需要進行在線更新;其中,
所述更新周期閾值為所述統計周期的M倍;其中,M為自然數,且≥2。
5.根據權利要求4所述的多分類模型自學習在線更新方法,其特征在于,若所述觸發機制為所述機制A或所述機制B,則所述根據新產生數據對待更新模型的訓練數據進行更新包括:
增量式更新:
檢驗所述新產生數據與所述待更新模型的歷史訓練數據的分布是否一致;
若一致,則將所述新產生數據與所述歷史訓練數據進行合并,生成訓練更新數據;其中,
若所述新產生數據與所述歷史訓練數據的各類樣本的占比差均小于預設占比閾值,則判定所述新產生數據與所述歷史訓練數據的分布一致。
6.根據權利要求5所述的多分類模型自學習在線更新方法,其特征在于,
若所述新產生數據與所述歷史訓練數據的分布不一致,則通過下采樣和過采樣的方式對所述歷史訓練數據的各類樣本進行循環式處理,直至所述新產生數據與所述歷史訓練數據的各類樣本的占比差均小于預設占比閾值;
將所述新產生數據與循環處理后的歷史訓練數據進行合并,生成所述訓練更新數據。
7.根據權利要求6所述的多分類模型自學習在線更新方法,其特征在于,若所述觸發機制為所述機制C,則所述根據新產生數據對待更新模型的訓練數據進行更新包括:
滾動式更新:
設定滾動固定時長,并根據所述滾動固定時長自所述新產生數據與所述歷史訓練數據中選取相應的數據的作為所述訓練更新數據;其中,
所述滾動固定時長為所述統計周期的L倍;其中,L為自然數,且L>M。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010922752.9/1.html,轉載請聲明來源鉆瓜專利網。





