[發(fā)明專利]一種基于手機信令數(shù)據(jù)的人口識別方法有效
| 申請?zhí)枺?/td> | 201710305183.1 | 申請日: | 2017-05-03 |
| 公開(公告)號: | CN107133318B | 公開(公告)日: | 2021-06-15 |
| 發(fā)明(設計)人: | 王家川;吳東東;石睿軒;肖冉東;王偉;杜勇;于海濤 | 申請(專利權(quán))人: | 北京市交通信息中心 |
| 主分類號: | G06F16/22 | 分類號: | G06F16/22;G06K9/62;H04M1/724 |
| 代理公司: | 北京科迪生專利代理有限責任公司 11251 | 代理人: | 楊學明;顧煒 |
| 地址: | 100161 *** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 手機 數(shù)據(jù) 人口 識別 方法 | ||
1.一種基于手機信令數(shù)據(jù)的人口識別方法,其特征在于:主要針對常住人口、就業(yè)人口和短期外來人口進行識別,通過以下步驟實現(xiàn):
(1)對手機信令數(shù)據(jù)進行預處理,提取可用字段,形成以用戶ID,即用戶唯一標識UID為關鍵字段的存儲格式,形成用戶的移動位置數(shù)據(jù);
(2)對每個用戶的移動位置數(shù)據(jù)按時間排序,根據(jù)速度異常判斷法和角度異常判斷法進行去噪,得到去噪后的移動位置數(shù)據(jù);
(3)根據(jù)步驟(2)去噪后的移動位置數(shù)據(jù),利用DBSCAN聚類算法進行聚類分析形成聚集點,識別出每個用戶每天的所有停留點及停留起止時間;所述停留點及停留起止時間識別方法是將同一用戶全天所有移動位置數(shù)據(jù)根據(jù)時間戳先后排序,將同一個簇號中時間連續(xù)的聚集點,劃分為一個停留點,并將停留點的最早時間和最晚時間作為該停留點的起止時間;
(4)以月為周期對停留點及停留起止時間進行分類,識別出常住人口、就業(yè)人口和短期外來人口;
所述步驟(2)中,速度異常判斷法為:讀取同一用戶按時間先后順序產(chǎn)生的手機信令數(shù)據(jù)中的坐標點A、B、C,分別計算中間點B到前后兩個點A、C的移動速度vAB和vBC,如果中間點B到前后兩個點的速度都大于120km/h,則判定B位置點為該用戶的速度異常點;
所述步驟(2)中,角度異常判斷法為:通過讀取同一用戶連續(xù)的4個位置點A、B、C、D,計算前后三個位置點所形成的夾角,分別計算A、B、C和B、C、D三個位置點所形成的夾角∠ABC和∠BCD,如果兩個夾角均小于π/4,則判定位置點C為用戶在行進過程中產(chǎn)生的異常點;
所述對手機信令數(shù)據(jù)進行預處理是:將手機信令數(shù)據(jù)按文件大小均勻分開存儲,使用的方法是:按用戶ID,即UID的哈希值后兩位存儲成256個不同的文件;再進行多線程處理,處理過程中剔除不符合要求,包括字段缺失、經(jīng)緯度不在計算區(qū)域、時間戳異常的數(shù)據(jù),形成如下以UID為關鍵字段的存儲格式:
第i個文件數(shù)據(jù)格式:(i,UID,時間戳,經(jīng)度,緯度,小區(qū),事件)
其中i為UID的哈希加密后第121~128位散列值;
所述步驟(3)中,利用DBSCAN聚類算法進行聚類分析形成聚集點的過程為:設置一個半徑為s的臨界區(qū)域,s由相鄰基站間距離差值的中值取整確定,從一個用戶分組里的第一個位置點開始,計算所有位置點與第一個位置點的距離D,如果所有距離都小于臨界區(qū)域,或者,距離小于臨界區(qū)域的點數(shù)大于最小包含點數(shù)2,則可以判斷為聚集點,標記聚集點的簇號,如果任何一個距離大于臨界區(qū)域,則帶入下一個位置點重復上述過程;
所述步驟(3)中,停留點及停留時間識別后,按用戶ID合并數(shù)據(jù),形成如下存儲方式:
其中非停留點標記為0;
所述步驟(4)中,識別出常住人口的過程為:判斷用戶甲在一天中的(0,6)∪(21,24)的時間區(qū)間內(nèi)是否存在停留點,并計算第k個月的情況:
如果Nk≥16,其中k=1,…,6,則識別用戶甲為常住人口;
所述步驟(4)中,識別出就業(yè)人口過程為:如果甲在第k月第i個工作日中的(8,18)時間區(qū)間內(nèi)存在停留點,并且停留點起止時間差大于4小時,則βi累加1,對第k個月的數(shù)據(jù)重復上述計算過程:
如果Jk≥12,其中k=1,…,6,則識別用戶甲為就業(yè)人口;
所述步驟(4)中,識別出短期外來人口的過程為:為用戶甲設置一個計數(shù)器N初始化為0,如果甲在一天中存在位置點,則N累加1;對一個月的數(shù)據(jù)重復上述計算過程,如果用戶甲的計數(shù)器N7,則識別用戶甲為短期外來人口。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京市交通信息中心,未經(jīng)北京市交通信息中心許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710305183.1/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 人口統(tǒng)計信息的空間可視化系統(tǒng)及其方法
- 一種基于移動互聯(lián)網(wǎng)的流動人口出入統(tǒng)計系統(tǒng)和方法
- 人口流動數(shù)據(jù)的獲取方法、裝置及計算機可讀存儲介質(zhì)
- 人口遷徙跟蹤展示方法、裝置及存儲介質(zhì)
- 一種基于深度神經(jīng)網(wǎng)絡的多因素融合學區(qū)學齡人口預測方法
- 一種在差補前提下基于移動信令數(shù)據(jù)的人口細分方法
- 護理保險測算方法、裝置、電子設備、存儲介質(zhì)
- 一種人口數(shù)據(jù)的顯示方法、裝置及設備
- 一種基于區(qū)塊鏈防止拐賣人口的方法
- 區(qū)域人口數(shù)量預測方法、裝置、電子設備和存儲介質(zhì)





