[發明專利]一種基于在線學習的多元時序數據規則挖掘方法在審
| 申請號: | 202011292898.6 | 申請日: | 2020-11-18 |
| 公開(公告)號: | CN112347162A | 公開(公告)日: | 2021-02-09 |
| 發明(設計)人: | 何國良;辛欣 | 申請(專利權)人: | 武漢大學 |
| 主分類號: | G06F16/2458 | 分類號: | G06F16/2458 |
| 代理公司: | 湖北武漢永嘉專利代理有限公司 42102 | 代理人: | 李丹 |
| 地址: | 430072 湖*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 在線 學習 多元 時序 數據 規則 挖掘 方法 | ||
1.一種基于在線學習的多元時序數據規則挖掘方法,其特征在于,包括以下步驟:
1)針對動態添加的多元時間序列數據,對各變量時間序列進行特征提取獲得各變量的候選特征集,并對其分別進行聚類得到若干個簇,在每個簇中選取性能最佳的特征作為核特征,獲得該變量時間序列的新數據特征集;
2)對各變量的現有特征集和該變量對應的新數據特征集進行相似性查詢,根據查詢結果做出相應操作,獲得多元時間序列數據的更新后的特征集;所述查詢結果分為存在相似特征和不存在相似特征;
若新數據特征與某現有特征的查詢結果為存在相似特征,則通過現有特征及新數據特征共同生成更新特征候選,然后采用基于統計量的自適應更新方法來選擇現有特征或特征候選作為更新后的特征,并將更新后的特征加入更新后的特征集;
若新數據特征與某現有特征的查詢結果為不存在相似特征,基于統計量的自適應更新方法判斷是否激活該新數據特征,若激活則將該新數據特征標記為更新后的特征,并將該特征加入更新后的特征集;
3)基于更新后的特征集進行分類規則的在線學習:根據步驟2)所得的更新后的特征集,更新現有規則以及挖掘新規則,獲得更新后的規則集;其中,更新后的規則集中每條規則由一個或多個特征構成,但最多只包含各變量的一個特征。
2.根據權利要求1所述的基于在線學習的多元時序數據規則挖掘方法,其特征在于,所述步驟1)中對各變量時間序列進行特征提取獲得各變量的候選特征集采用基于廣義特征向量法分別對各變量時間序列進行特征提取。
3.根據權利要求2所述的基于在線學習的多元時序數據規則挖掘方法,其特征在于,所述步驟1)中廣義特征向量法具體如下:首先,通過最大化類別i和類別j的投影數據方差的比率獲得一個稀疏的、塊狀的特征指示向量v;然后,通過得到的特征指示向量v將相應變量的時間序列轉化為特征shapelets。
4.根據權利要求1所述的基于在線學習的多元時序數據規則挖掘方法,其特征在于,所述步驟2)中相似性查詢采用DTW距離計算兩個特征之間的相似性。
5.根據權利要求1所述的基于在線學習的多元時序數據規則挖掘方法,其特征在于所述步驟2)中若查詢結果為存在相似特征,則通過現有特征集及新數據特征集共同生成更新后的特征集為采用DBA方法平均該現有特征及其相似的新數據特征來生成更新特征。
6.根據權利要求1所述的基于在線學習的多元時序數據規則挖掘方法,其特征在于所述步驟2)中采用基于統計量的自適應更新方法來選擇現有特征或特征候選作為更新后的特征為給定一個現有特征及其更新特征候選,當該候選在訓練數據集中匹配的實例數大于設定統計量閾值時,判斷現有特征及其更新特征候選的在線評估指標的大小,選擇在線評估指標大的作為更新后的特征。
7.根據權利要求1所述的基于在線學習的多元時序數據規則挖掘方法,其特征在于,所述步驟2)中基于統計量的自適應更新方法判斷是否激活該新數據特征為當該新數據特征在訓練數據集中匹配的實例數大于統計量閾值時,若該新數據特征的在線評估指標滿足預先指定值,則激活該新數據特征,否則,不激活該新數據特征。
8.根據權利要求1所述的基于在線學習的多元時序數據規則挖掘方法,其特征在于,所述步驟3)中所述更新現有規則具體如下:
對現有規則集中每個規則,若在該規則中存在一個或多個特征被更新,則通過替換這些特征為其更新后的特征版本,來生成更新規則候選,并采用基于統計量的自適應更新方法確定是否將該規則候選加入到現有規則集中;
所述挖掘新規則具體如下:
對新特征構成的特征集,采用關聯規則方法挖掘新規則,并基于統計量的自適應更新方法判斷是否激活該新規則,若激活則將該新規則加入現有規則集中。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于武漢大學,未經武漢大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011292898.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種基于眾包模式的樣本標注方法
- 下一篇:一種適用于冰場的實時監控系統





