[發明專利]一種時空規律的地鐵乘客聚類和邊緣檢測方法有效
| 申請號: | 201310750251.7 | 申請日: | 2013-12-31 |
| 公開(公告)號: | CN103699801B | 公開(公告)日: | 2017-01-11 |
| 發明(設計)人: | 趙娟娟;張帆;白雪;須成忠;鄒瑜斌;田臣;熊文 | 申請(專利權)人: | 深圳先進技術研究院 |
| 主分類號: | G06F19/00 | 分類號: | G06F19/00 |
| 代理公司: | 深圳市科進知識產權代理事務所(普通合伙)44316 | 代理人: | 沈祖鋒,郝明琴 |
| 地址: | 518055 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 時空 規律 地鐵 乘客 邊緣 檢測 方法 | ||
技術領域
本發明屬于信息數據處理技術領域,具體涉及一種時空規律的地鐵乘客聚類和邊緣檢測方法。
背景技術
相比傳統的公共交通付費方式,如現金支付、年卡、月卡,智能卡具有方便性、便捷性、成本低等優點;相比傳統的公共交通數據采集、決策服務能力、生活服務能力等方面,智能卡具有數據完整性、一致性、數據采集成本低、分析結果精準性、可靠等優點。
綜上,智能卡的使用已經帶來了非常明顯的方便和好處,智能卡在現代公共交通方面已成為不可或缺的工具,得到了快速普及和廣泛的應用。在大數據時代,以交通智能卡消費數據為核心,挖掘市民生活特征及規律已成為智慧城市等領域研究的重要方向之一,目前對智能卡消費數據的分析主要集中在三個方面:1、基礎數據分析;2、乘客行為分析、乘客需求預測、個人出行模式分析;3、結合一、二兩方面做交通長期規劃,策略調整,提高交通質量、生活服務能力和數據決策服務能力。
目前,基于乘客的時空規律對乘客進行分類的相關研究比較少,現有的相關研究主要集中于結合智能卡的類型對乘客做分析,并比較不同類型的乘客特征的差異性。而針對乘客的時空特征對乘客分類的相關研究比較少。
發明內容
本發明要解決的技術問題在于提供一種時空規律的地鐵乘客聚類和邊緣檢測方法,具有高穩定性、可靠性、安全性。
本發明的技術方案包括一種時空規律的地鐵乘客聚類和邊緣檢測方法,包括如下步驟:
S1、從包含乘客所有乘車記錄的源數據中獲取時空規律的地鐵乘客的時空規律詳細信息;
S2、根據所述獲取的時空規律詳細信息,對時空規律的地鐵乘客進行聚類;
S3、對聚類后的時空規律的地鐵乘客進行邊緣檢測及邊緣特征分析。
進一步地,所述源數據包括智能交通卡消費信息表和地鐵線路表;
所述智能交通卡消費信息表包括智能交通卡的卡號、地鐵站刷卡終端的終端號、用戶的刷卡時間、進站或出站標識;
所述地鐵線路表包括線路名稱、途經站點、線路類型,所述線路類型包括上行和下行;
所述時空規律的地鐵乘客為出行時間和出行地點均比較規律的乘客。
進一步地,所述步驟S1具體包括:
S11、對包含乘客所有乘車記錄的源數據進行數據預處理;
S12、以智能交通卡的卡號作為唯一標識,從經過數據預處理后的數據中讀取每張卡的乘車記錄;
S13、對乘客進行分類,將時空規律乘客的tag值設為一預定值;
S14、對于所述步驟S13中分類后的時空規律乘客,將全天分成n個時間段,計算時空規律乘客乘車各時間段的乘車天數其中Dnum為乘客刷卡總天數,i為第i天,j為時間段;
S15、對于所述T中的所有時段的乘車天數,通過比較相鄰各時段的乘車天數的值,獲取滿足時間密集概率的各時段峰值;
S16、對所述步驟S15中獲取的每一個峰值對應的時間段,判斷在所述時間段內乘客出行地點是否規律,若是,則將此峰值的詳細信息添加到規律時空詳情列表sptmList,所述詳細信息包括時間密集概率、空間密集概率、密集的時間段、密集的進出站對;
S17、計算所述規律時空詳情列表sptmList中元素的數量并將所述數量賦值給size,size做為這名乘客的中心點;
S18、判斷所有乘客是否都被處理并且找到所有的峰值,若是則結束,否則返回執行步驟S11。
進一步地,所述步驟S2具體包括:
S21、以智能交通卡的卡號作為唯一標識,從規律時空詳情列表sptmList中讀取一張卡的所有時空規律詳細信息P;
S22、判斷是否有任何簇建立,若沒有,則建立新簇C,并將對象P加入簇C,將對象P標識為已處理,簇C的中心值為對象P的峰值數量size;若已經有簇建立,則執行步驟S23;
S23、計算對象P與每個簇中心的距離;若存在某個簇Ci的中心與對象P的峰值數量size相等,則將所述對象P歸類到簇Ci;否則,建立新簇Cj,并將對象P加入簇Cj;
S24、重復執行步驟S21-S23,直到所有對象都被處理并歸入了某個簇,并按照簇中智能交通卡的卡號的數量對所有簇排序。
進一步地,所述步驟S3具體包括:
S31、基于簇的大小,對所有簇分類,將簇劃分為邊緣簇abnCluster和非邊緣簇nCluster,其中所述邊緣簇abnCluster為簇的數量與平均簇的數量的比值小于設定閾值的簇,非邊緣簇nCluster為簇的數量與平均簇的數量的比值大于或等于設定閾值的簇;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳先進技術研究院,未經深圳先進技術研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310750251.7/2.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06F 電數字數據處理
G06F19-00 專門適用于特定應用的數字計算或數據處理的設備或方法
G06F19-10 .生物信息學,即計算分子生物學中的遺傳或蛋白質相關的數據處理方法或系統
G06F19-12 ..用于系統生物學的建?;蚍抡妫纾焊怕誓P突騽討B模型,遺傳基因管理網絡,蛋白質交互作用網絡或新陳代謝作用網絡
G06F19-14 ..用于發展或進化的,例如:進化的保存區域決定或進化樹結構
G06F19-16 ..用于分子結構的,例如:結構排序,結構或功能關系,蛋白質折疊,結構域拓撲,用結構數據的藥靶,涉及二維或三維結構的
G06F19-18 ..用于功能性基因組學或蛋白質組學的,例如:基因型–表型關聯,不均衡連接,種群遺傳學,結合位置鑒定,變異發生,基因型或染色體組的注釋,蛋白質相互作用或蛋白質核酸的相互作用





