[發明專利]一種基于在線學習的多元時序數據規則挖掘方法在審
| 申請號: | 202011292898.6 | 申請日: | 2020-11-18 |
| 公開(公告)號: | CN112347162A | 公開(公告)日: | 2021-02-09 |
| 發明(設計)人: | 何國良;辛欣 | 申請(專利權)人: | 武漢大學 |
| 主分類號: | G06F16/2458 | 分類號: | G06F16/2458 |
| 代理公司: | 湖北武漢永嘉專利代理有限公司 42102 | 代理人: | 李丹 |
| 地址: | 430072 湖*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 在線 學習 多元 時序 數據 規則 挖掘 方法 | ||
本發明公開了一種基于在線學習的多元時序數據規則挖掘方法,包括以下步驟:1)針對動態添加的多元時序數據,對各變量時間序列進行特征提取獲得各變量的候選特征集,并對其分別進行聚類得到若干個簇,在每個簇中選取性能最佳的特征作為核特征,獲得該變量時間序列的新數據特征集;2)對各變量的現有特征集和該變量對應的新數據特征集進行相似性查詢,根據查詢結果做出相應操作,獲得多元時序數據的更新后的特征集;3)基于更新后的特征集進行分類規則的在線學習。本發明方法具有較好的可解釋性、魯棒性和穩定性。
技術領域
本發明涉及數據挖掘技術,尤其涉及一種基于在線學習的多元時序數據規則挖掘方法。
背景技術
近年來,在數據挖掘技術領域,多變量時間序列分類問題已經成為了一大熱點,并在現實應用中引起了廣泛關注,如人類活動識別、醫學診斷、入侵檢測、過程控制和金融預測等。由于其適用性,多變量時間序列分類在近十年內得到了充分的研究,并提出了許多批處理學習方法,分為傳統的線性模型,如指數平滑模型、自回歸整合移動平均模型和線性回歸模型等,以及傳統的非線性模型,如神經網絡、支持向量機和極限學習機等。
針對多變量時間序列分類模型的批量學習問題,Guoliang He等學者提出了基于核特征早期預測多變量時間序列類別的分類方法。在該方法中,提出了一種新的核特征評估指標,從而保證了分類的準確性和早期性。Usue Mori等學者提出了一種基于概率模型的時間序列分類方法。該方法分析每個類在每個時間戳上的鑒別力,并選擇滿足每個類的精度都超過閾值的時間戳。
為進一步提高傳統分類模型的性能,提出了許多有效的在線學習方法。例如,YuSun等學者提出了一個基于類的在線集成學習方法,該方法通過對基礎學習者動態更新來快速適應數據的演化。為彌補一階成本敏感在線學習算法的不足,Peilin Zhao等學者提出了自適應正則化成本敏感的在線梯度下降算法,該算法能夠更好地權衡分類性能和時間效率之間的關系。Changsheng Li等學者提出了一個在線多輸出回歸方法,該方法可以在線學習回歸系數的結構,從而促進分類模型的不斷細化。
上述最先進的傳統分類學習方法在很多現實應用上都取得了較好的效果,但是仍然存在一些局限性:
(1)對于大規模的多變量時間序列訓練數據,傳統分類模型學習非常耗時。此外,當新數據動態加入時,分類模型需要從零開始重新訓練,這導致了極高的時間成本。
(2)隨著多變量時間序列訓練數據數量的增加,傳統分類模型的性能提升無法達到預期的效果。
(3)由于時間序列的高維性和變量間的復雜關系,現有的在線學習方法無法有效地處理多變量時間序列。到目前為止,多元時序數據分類規則的在線學習方法的相關研究還很少。
發明內容
本發明要解決的技術問題在于針對現有技術中的缺陷,提供一種基于在線學習的多元時序數據規則挖掘方法。
本發明解決其技術問題所采用的技術方案是:一種基于在線學習的多元時序數據規則挖掘方法,包括以下步驟:
1)針對動態添加的多元時間序列數據,對各變量時間序列進行特征提取獲得各變量的候選特征集,并對各變量的候選特征集分別進行聚類得到若干個簇,在每個簇中選取性能最佳的特征作為核特征,獲得該變量時間序列的新數據特征集;
2)對各變量的現有特征集和該變量對應的新數據特征集進行相似性查詢,根據查詢結果做出相應的更新操作,獲得多元時間序列數據的更新后的特征集;所述查詢結果分為存在相似特征和不存在相似特征;
若新數據特征與某現有特征的查詢結果為存在相似特征,則通過現有特征及新數據特征共同生成更新特征候選,然后采用基于統計量的自適應更新方法來選擇現有特征或特征候選作為更新后的特征,并將更新后的特征加入更新后的特征集;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于武漢大學,未經武漢大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011292898.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種基于眾包模式的樣本標注方法
- 下一篇:一種適用于冰場的實時監控系統





