[發明專利]一種數據聚類方法及裝置在審
| 申請號: | 201611027693.9 | 申請日: | 2016-11-17 |
| 公開(公告)號: | CN108073939A | 公開(公告)日: | 2018-05-25 |
| 發明(設計)人: | 鮑媛媛 | 申請(專利權)人: | 中國移動通信有限公司研究院;中國移動通信集團公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 北京同達信恒知識產權代理有限公司 11291 | 代理人: | 朱琳愛義 |
| 地址: | 100053 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 聚類 聚類中心 數據概念 數據聚類 最短距離 抽取 自動化 傳感器數據 形狀數據 異構設備 互操作 準確率 互補性 協同 分析 保證 | ||
1.一種數據聚類方法,其特征在于,包括:
根據多個傳感器采集到的時間序列生成多維字符串序列;
根據所述多維字符串序列中的各字符串序列,以及各所述傳感器采集時間序列時的時間和地點,構建所述字符串序列、所述時間和所述地點的三元組;
將每個所述三元組作為一個節點,分別確定各所述節點之間的距離函數;
分別確定各所述節點的局部密度,以及各所述節點與具有更高局部密度的節點之間的最短距離;
根據確定出的各所述節點的局部密度,以及各所述節點與具有更高局部密度的節點之間的最短距離,確定各聚類中心節點以及除各所述聚類中心節點之外的各所述節點的所屬類別。
2.如權利要求1所述的數據聚類方法,其特征在于,所述根據多個傳感器采集到的時間序列生成多維字符串序列,具體包括:
將各所述傳感器采集到的時間序列組合生成所述多維時間序列;
對所述多維時間序列進行標準化處理,生成標準化的多維時間序列;
對所述標準化的多維時間序列進行降維處理;
根據標準正態分布的等概率區間劃分點查找表,對降維處理后的多維時間序列進行符號化處理,生成所述多維字符串序列。
3.如權利要求2所述的數據聚類方法,其特征在于,對所述標準化的多維時間序列進行降維處理,具體包括:
根據各所述傳感器設置的滑動窗口,確定所述標準化的多維時間序列中的各子時間序列在所述滑動窗口中的均值,生成包含各子時間序列均值的均值時間序列。
4.如權利要求2或3所述的數據聚類方法,其特征在于,分別確定各所述節點之間的距離函數,具體包括:
利用如下公式確定節點E
d
其中,s
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國移動通信有限公司研究院;中國移動通信集團公司,未經中國移動通信有限公司研究院;中國移動通信集團公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611027693.9/1.html,轉載請聲明來源鉆瓜專利網。





