[發明專利]一種基于手機信令分析和提取用戶移動軌跡的方法在審
| 申請號: | 202011237478.8 | 申請日: | 2020-11-09 |
| 公開(公告)號: | CN112765120A | 公開(公告)日: | 2021-05-07 |
| 發明(設計)人: | 何利文;趙金城 | 申請(專利權)人: | 南京郵電大學 |
| 主分類號: | G06F16/182 | 分類號: | G06F16/182;G06F16/215;G06F16/2455;G06F16/2458;G06F16/248;G06F16/28;H04L29/08;H04W4/029;H04W4/20 |
| 代理公司: | 南京蘇高專利商標事務所(普通合伙) 32204 | 代理人: | 曹坤 |
| 地址: | 210003 江蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 手機 分析 提取 用戶 移動 軌跡 方法 | ||
1.一種基于手機信令分析和提取用戶移動軌跡的方法,其特征在于,具體步驟包括如下:
步驟(1.1)、首先通過Flume數據采集系統采集手機信令數據源并儲存;
步驟(1.2)、針對目標歷史軌跡的分析,由Flume數據采集系統將儲存的歷史數據進行采集并存儲到HDFS分布式文件系統中;
步驟(1.3)、對存儲到HDFS分布式文件系統中的歷史數據進行數據清洗;
步驟(1.4)、數據清洗完成后,加載到Hive數據倉庫,根據每個用戶的數據通過計算分析出用戶的離線歷史軌跡,
步驟(1.5)、將用戶的離線歷史軌跡數據存儲到MySQL關系數據庫中,按照天進行分區,用于后續查詢或加載到ES搜索引擎中便于快速檢索;
步驟(1.6)、針對目標實時軌跡的分析,通過Kafka消息系統訂閱實時信令數據,
步驟(1.7)、經過Storm流式計算框架對實時信令數據進行分析,記錄用戶的狀態:即當前位置和出現時間;當獲取到一條新的數據及目標位置發生變化時,則更新用戶的狀態信息,從而計算出用戶的實時軌跡序列數據;
步驟(1.8)、將用戶的實時軌跡序列數據緩存至Redis中,通過GIS地圖軟件按時間序列顯示出用戶的軌跡。
2.根據權利要求1所述的一種基于手機信令分析和提取用戶移動軌跡的方法,其特征在于,在步驟(1.1)中,實時的數據源包括設備數據、系統數據集其它數據。
3.根據權利要求1所述的一種基于手機信令分析和提取用戶移動軌跡的方法,其特征在于,在步驟(1.3)中,所述對存儲到HDFS分布式文件系統中的歷史數據進行數據清洗的具體操作步驟如下:
(1.3.1)、字段缺失數據:手機信令數據包含imsi手機串號、時間戳和基站經緯度,對缺失字段信息的記錄進行刪除;
(1.3.2)、漂移數據:先設置一個閾值,計算兩個基站之間的距離和時間差求得用戶速度,將其與閾值進行比較,若大于閾值,則說明用戶未離開當前基站范圍;
(1.3.3)、重復數據:根據用戶手機信令經緯度重復的記錄,保留時間最早和最遲共兩條記錄,即用戶在基站信號范圍內的出現時間和離開時間,其余的全部刪除;
(1.3.4)、離群數據點:先使用k-means聚類算法進行預處理,濾除非離群點數據,然后使用LOF離群點檢測算法在剩余的數據中檢測離群點,將其刪除。
4.根據權利要求1所述的一種基于手機信令分析和提取用戶移動軌跡的方法,其特征在于,在步驟(1.4)中,所述的用戶的歷史軌跡包括imsi、基站位置、用戶的出現時間及離開時間。
5.根據權利要求1所述的一種基于手機信令分析和提取用戶移動軌跡的方法,其特征在于,在步驟(1.6)中,所述的Kafka消息系統是一種分布式高吞吐的消息發布訂閱系統,用于保存實時數據。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京郵電大學,未經南京郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011237478.8/1.html,轉載請聲明來源鉆瓜專利網。





