[發明專利]一種利用k均值聚類算法識別就業地的方法在審
| 申請號: | 202110255241.0 | 申請日: | 2021-03-08 |
| 公開(公告)號: | CN112966750A | 公開(公告)日: | 2021-06-15 |
| 發明(設計)人: | 吳曉;胡明星;邵云通;張瑞琪;何彥 | 申請(專利權)人: | 東南大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 北京同輝知識產權代理事務所(普通合伙) 11357 | 代理人: | 張明利 |
| 地址: | 210096 江蘇省*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 利用 均值 算法 識別 就業 方法 | ||
本發明公開了一種利用k均值聚類算法識別就業地的方法,屬于城市就業地研究領域。本發明以手機基站形成的泰森多邊形作為待識別單元;對任一待識別單元兩個工作日內的進出活動發生時間點進行數據統計;通過對用戶每條手機信令數據記錄的基站位置信息和前后記錄的基站位置信息進行比較,來判斷用戶行為。之后統計各待識別單元所有用戶的最晚離開時間節點、最早進入時間節點、停留時間長度,并利用K均值聚類法分析各待識別單元的質心分布規律,通過滿足停留時間長度閾值的質心數量、停留時間長度的正負方向,以及各質心進出時間的重疊/間隔區間來共同判斷待識別單元是否為就業地及其類型。
技術領域
本發明涉及城市就業地研究領域,具體涉及一種利用k均值聚類算法識別就業地的方法。
背景技術
就業地是城市居民參與生產活動而構成的固定空間范圍——時間上,在就業地參與生產活動的時間具有規律性,通常呈現白天人多,晚上人少的特征;地點固定性,是居民參與生產活動頻繁使用的空間。因此,根據上述特征,本研究探討的就業地是指城市居民參與生產活動的地理位置。
傳統的就業地識別思路主要依賴于用戶白天數據的規律性,即通過用戶白天在一個周期內不同時間節點出現在同一基站的次數累加起來判斷是否為就業地,有一定的可操作性和合理性。
目前,上述識別方法最大的問題是:首先,識別時間主要依賴單時段(白天)用戶的基站移動情況,而很可能將上夜班、兩班倒和三班倒(如醫院和工廠等特定的企事業單元)的實際就業地忽略,甚是誤判為用戶居住地;其次,該方法從用戶個體行為數據角度直接判斷其就業地,預先假設了用戶“白天上班,晚上居家”的行為模式,忽略了用戶除就業以外的出行,缺少在微觀空間單元內對大量用戶數據進行統計分析以準確判斷該微觀空間單元是否為就業地。
發明內容
針對現有技術的不足,本發明提出了一種利用k均值聚類算法識別就業地的方法,通過同步采納和分析手機用戶的白天和夜間的大數據進行“整日識別”,能夠精準識別其居住地與就業地,避免了傳統方法的疏漏;在以基站作為空間單元的基礎上,以用戶行為模式作為樣本進行聚類分析,能夠準確的判斷各空間單元中占主導的人群活動方式,并進一步判斷就業者的實際就業模式和空間單元的就業/居住類型。本發明的目的可以通過以下技術方案實現:
一種利用k均值聚類算法識別就業地的方法,包括以下步驟:
根據區域內目標基站的經緯度信息數據生成泰森多邊形,并以泰森多邊形作為待識別單元;
根據區域內的兩個相鄰工作日的手機信令數據進行清洗并統計所有用戶進入和離開所述待識別單元行為發生的時間節點;
將所有用戶的最晚離開時間節點減去對應用戶的最早進入時間節點獲取用戶的停留時間長度;
采用k均值聚類算法對所述用戶最晚離開時間節點、所述用戶最早進入時間節點和所述用戶的停留時間長度進行聚類分析獲取質心,并根據所述質心計算所述質心之間進出時間點重疊/間隔區間;
根據滿足所述停留時間長度閾值的質心數量、所述停留時間長度的正負方向和所述進出時間點重疊/間隔區間判斷所述待識別單元是否為就業地及就業地種類。
進一步地,所述最晚離開時間節點的選取包含以下步驟:
若用戶滿足在第一天工作日存在離開所述待識別單元的記錄,則選取所述第一天工作日的最晚離開時間節點為所述最晚離開時間節點;
若用戶不滿足在第一天工作日存在離開所述待識別單元的記錄,則選取所述第二天工作日的最晚離開時間節點為所述最晚離開時間節點。
在用戶第二天0點前無離開行動記錄的前提下,取第二天24點前最晚離開時間節點,目的在于同時統計當日進出與隔日進出兩種行動模式中的最晚離開時間節點。居民進出居住地多為當日進出,因此其最晚離開時間-最早進入時間<0;而夜班工作人員進出夜班就業地多為隔日進出,其最晚離開時間-最早進入時間>0。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于東南大學,未經東南大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110255241.0/2.html,轉載請聲明來源鉆瓜專利網。





