[發明專利]一種面向變分布數據流的在線分類方法有效
| 申請號: | 202011455187.6 | 申請日: | 2020-12-10 |
| 公開(公告)號: | CN112528111B | 公開(公告)日: | 2023-10-20 |
| 發明(設計)人: | 尹宏鵬;周瀚;廖城霖;鐘錦濤 | 申請(專利權)人: | 重慶大學 |
| 主分類號: | G06F16/906 | 分類號: | G06F16/906 |
| 代理公司: | 北京同恒源知識產權代理有限公司 11275 | 代理人: | 趙榮之 |
| 地址: | 400044 重*** | 國省代碼: | 重慶;50 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 面向 分布 數據流 在線 分類 方法 | ||
1.一種面向變分布數據流的在線分類方法,其特征在于:該方法包括以下步驟:
步驟一:離線訓練階段;利用歷史數據流的標簽數據訓練一個離線分類器,記為Γh;
步驟二:在線訓練階段;若有新的訓練標簽數據批次,則進入在線訓練階段,調整新數據分布并學習在線分類器,記為Γn;
步驟三:在線測試階段;若有無標簽測試數據到來,則綜合離線分類器Γh與在線分類器Γn形成集成分類器Γ預測該數據標簽。
2.根據權利要求1所述的一種面向變分布數據流的在線分類方法,其特征在于:所述步驟一具體為:
S1.1:將歷史流數據Xh切割為兩段,記為舊歷史數據與新歷史數據
S1.2:調整舊歷史數據與新歷史數據分布,使其條件概率分布一致,其數學表示如下:
其中,表示舊歷史數據中屬于k類樣本的平均值,表示新歷史數據中屬于k類樣本的平均值;對上述方程求解得:
利用分布變換矩陣A調整新歷史數據分布使其與舊歷史數據分布一致,即
S1.3:利用歷史數據與訓練出離線分類器Γh。
3.根據權利要求2所述的一種面向變分布數據流的在線分類方法,其特征在于:所述步驟二具體為:
S2.1:利用離線分類器Γh初始化在線分類器Γn;
S2.2:初始化離線分類器Γh與在線分類器Γn的權重μ與ν;
S2.3:若在t+1時刻有新的訓練數據批次更新分布變換矩陣A:
其中,表示所有歷史數據中屬于k類樣本的平均值,表示新批次數據中屬于k類樣本的平均值;求解上述方程得:
S2.4:利用變換后數據更新在線分類器Γn;
S2.5:利用下述策略更新離線分類器Γh與在線分類器Γn的權重:
其中β為(0,1)的權重參數;z(t)=trace(Iz),其中Iz為對角陣:
r(t)=trace(Ir),其中Ir為對角陣:
4.根據權利要求3所述的一種面向變分布數據流的在線分類方法,其特征在于:所述步驟三具體為:
S3.1:若有新測試數據xnew到來,利用變換矩陣A將數據至分布一致空間中,即Axnew;
S3.2:集成離線分類器與在線分類器:
Γ=μΓh+νΓn
則利用集成分類器Γ對新數據的Axnew標簽進行預測并輸出。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于重慶大學,未經重慶大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011455187.6/1.html,轉載請聲明來源鉆瓜專利網。





