[發明專利]一種基于DBSCAN聚類算法的出行與活動模式識別方法有效
| 申請號: | 201610066709.0 | 申請日: | 2016-01-29 |
| 公開(公告)號: | CN105740904B | 公開(公告)日: | 2019-10-11 |
| 發明(設計)人: | 葉智銳;施曉蒙;湯斗南;趙鑫瑋;陸加健;吳運騰;吳麗霞 | 申請(專利權)人: | 東南大學 |
| 主分類號: | G06F16/906 | 分類號: | G06F16/906 |
| 代理公司: | 南京蘇高專利商標事務所(普通合伙) 32204 | 代理人: | 孟紅梅 |
| 地址: | 210096*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 dbscan 算法 出行 活動 模式識別 方法 | ||
1.一種基于DBSCAN聚類算法的出行與活動模式識別方法,其特征在于,該方法包括如下步驟:
(1)數據清洗:對持續采集的出行者時空軌跡數據集進行清洗;
(2)出行模式識別:計算清洗后的數據集坐標點的平均速度,將平均速度高于設定閾值的位置坐標點歸類為出行模式;
(3)活動模式識別,包括活動起點識別和活動終點識別,具體為:基于DBSCAN聚類算法對清洗后的數據集進行聚類分析,根據聚類結果判別活動起點和終點,在指定的時間間隔T1內的有大于指定的最小包含點數N1的數據點與數據點A的距離均小于指定的距離D1,則數據點A判別為活動的起點;若存在在指定的時間間隔T2內且不屬于半徑為D2的臨界區域中的一個連續的數據點集,則該數據點集的第一個點判別為活動的終點;其中數據清洗后的每個數據點包括三個參數: UTC時間、經度、緯度;對DBSCAN算法輸入三個參數:數據點、時間間隔T1、搜索領域半徑,最小包含點數由時間間隔T1與時間中值的比值求出,并四舍五入取整,其中時間中值為相鄰數據點的時間差值的中值;
(4)生成出行時刻表:根據識別出的出行模式和活動模式的數據點坐標和時間,生成出行時刻表。
2.根據權利要求1所述的基于DBSCAN聚類算法的出行與活動模式識別方法,其特征在于,所述數據清洗步驟中包括移除邊界點的步驟,所述邊界點為連續具有高于設定速度閾值的點坐標序列的起始坐標點。
3.根據權利要求1所述的基于DBSCAN聚類算法的出行與活動模式識別方法,其特征在于,所述出行模式識別步驟中包括:
選定一時間間隔,計算每個時間間隔內數據點的平均速度;
繪制平均速度隨時間變化的曲線,設置一速度閾值;
將平均速度高于所設速度閾值的位置坐標點歸類為出行模式。
4.根據權利要求1所述的基于DBSCAN聚類算法的出行與活動模式識別方法,其特征在于,活動起點的識別步驟包括:
設置臨界區域的半徑為D1,時間間隔為T1,最小包含點數N1,其中N1根據時間間隔T1與時間中值的比值確定;
對聚類結果的每個分組數據進行如下運算:從第一個數據點開始,計算在時間間隔T1區間內的所有坐標點與第一個數據點的距離,若所有距離均小于D1,或者,距離小于D1的點數大于N1,則該第一個數據點為活動的起點;帶入下一個數據點進行同樣的運算,直至遍歷完成一個分組中的所有數據點。
5.根據權利要求1所述的基于DBSCAN聚類算法的出行與活動模式識別方法,其特征在于,活動終點的識別步驟包括:
設置臨界區域的半徑為D2,時間間隔為T2;
對聚類結果的每個分組數據進行如下運算:找到時間間隔T2內且不屬于臨界區域中的一個連續的序列點數據集,這個序列點數據集的第一個點將作為下一個活動行為的判定起點,即本次的終點。
6.根據權利要求1所述的基于DBSCAN聚類算法的出行與活動模式識別方法,其特征在于,所述時間間隔T1為3分鐘,距離D1為20米,時間間隔T2為10分鐘,距離D2為100米。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于東南大學,未經東南大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610066709.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種融合感知信息的協同分割方法
- 下一篇:一種求解二次圖匹配模型的方法





