[發明專利]一種時間序列的分類方法及裝置在審
| 申請號: | 201510097947.3 | 申請日: | 2015-03-05 |
| 公開(公告)號: | CN104657749A | 公開(公告)日: | 2015-05-27 |
| 發明(設計)人: | 張莉;陶志偉;王邦軍;張召;李凡長;楊季文 | 申請(專利權)人: | 蘇州大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 常亮 |
| 地址: | 215123 江蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 時間 序列 分類 方法 裝置 | ||
技術領域
本發明涉及數據挖掘領域,尤其涉及一種時間序列的分類方法及裝置。
背景技術
時間序列的分類問題一直是數據挖掘領域研究人員關注的重點。時間序列是某種現象或統計指標在不同時間段內、按照時間順序排列而成的有序序列。隨著大數據時代的到來,快速有效地對雜亂無章的時間序列的分類顯得尤為重要。
發明內容
本發明提供了一種時間序列的分類方法及裝置,本申請能夠快速有效地對雜亂無章的時間序列進行分類。
為了實現上述目的,本發明提供了下述技術手段:
一種時間序列的分類方法,包括:
將一測試時間序列按時間順序分為若干個測試時間子序列,生成測試時間子序列集;
逐個計算所述測試時間子序列集與多個預設類別碼本之間的歐式距離;
將最小歐式距離對應預設類別碼本的類別賦予所述測試時間序列;
其中,每個預設類別碼本為對每個訓練類別子集執行K均值聚類算法后生成K個聚類中心的集合,所述每個訓練類別子集為對每個訓練時間序列子集中每個訓練時間序列按時間順序分段后形成多個訓練時間分段序列的集合,所述每個訓練時間序列子集為按類別標簽對訓練時間序列集合分類后生成的、僅包含一個類別標簽訓練時間序列的集合,訓練時間序列集合中包括若干個已知類別標簽的訓練時間序列。
優選的,預先構建多個預設類別碼本的過程包括:
獲得訓練時間序列集合,其中所述訓練時間序列集合中包括若干個已知類別標簽的訓練時間序列;
按類別標簽對所述訓練時間序列集合分類、生成與類別標簽一一對應的多個訓練時間序列子集,其中,每個訓練時間序列子集中僅包含一個類別標簽的至少一個訓練時間序列;
對每個訓練時間序列子集中每個訓練時間序列按時間順序分段形成多個訓練時間分段序列,將該訓練時間序列子集中與每個訓練時間序列對應的多個訓練時間分段序列的集合、作為該訓練時間序列子集對應類別的訓練類別子集;
對每個訓練類別子集執行K均值聚類算法生成K個聚類中心,將K個聚類中心的集合作為訓練類別子集對應的碼本,將每個訓練類別子集對應的碼本作為多個預設類別碼本,其中,碼本由K個碼詞組成,每個聚類中心對應一個碼詞。
一種時間序列的分類方法,包括:
將一測試時間序列按時間順序分為若干個測試時間子序列,生成測試時間子序列集;
對所述測試時間子序列集采用K均值聚類算法生成K個聚類中心,將所述K個聚類中心的集合作為所述測試時間序列的測試碼本;
逐個計算所述測試碼本與多個預設類別碼本之間的歐式距離;
將最小歐式距離對應預設類別碼本的類別賦予所述測試時間序列;
其中,每個預設類別碼本為對每個訓練類別子集執行K均值聚類算法后生成K個聚類中心的集合,所述每個訓練類別子集為對每個訓練時間序列子集中每個訓練時間序列按時間順序分段后形成多個訓練時間分段序列的集合,所述每個訓練時間序列子集為按類別標簽對訓練時間序列集合分類后生成的、僅包含一個類別標簽訓練時間序列的集合,訓練時間序列集合中包括若干個已知類別標簽的訓練時間序列。
優選的,預先構建多個預設類別碼本的過程包括:
獲得訓練時間序列集合,其中所述訓練時間序列集合中包括若干個已知類別標簽的訓練時間序列;
按類別標簽對所述訓練時間序列集合分類、生成與類別標簽一一對應的多個訓練時間序列子集,其中,每個訓練時間序列子集中僅包含一個類別標簽的至少一個訓練時間序列;
對每個訓練時間序列子集中每個訓練時間序列按時間順序分段形成多個訓練時間分段序列,將該訓練時間序列子集中與每個訓練時間序列對應的多個訓練時間分段序列的集合、作為該訓練時間序列子集對應類別的訓練類別子集;
對每個訓練類別子集執行K均值聚類算法生成K個聚類中心,將K個聚類中心的集合作為訓練類別子集對應的碼本,將每個訓練類別子集對應的碼本作為多個預設類別碼本,其中,碼本由K個碼詞組成,每個聚類中心對應一個碼詞。
一種時間序列的分類方法,包括:
將一測試時間序列按時間分為若干個測試時間子序列,生成測試時間子序列集;
在一個預設類別碼本中為每個測試時間子序列選擇一個對應的碼詞,將每個測試時間子序列對應的碼詞組成所述測試時間序列的一個重構測試時間序列,該重構測試時間序列的類別與該預設類別碼本的類別一致,按上述構建重構測試時間序列的方式構建所述測試時間序列與所有預設類別碼本一一對應的多個重構測試時間序列;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于蘇州大學;,未經蘇州大學;許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510097947.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一次性防盜電子鋼絲封
- 下一篇:基于HU不變矩實現車標自動識別的方法





