[發明專利]一種大數據環境下公交載客量實時分析預測方法有效
| 申請號: | 201810860244.5 | 申請日: | 2018-07-31 |
| 公開(公告)號: | CN109035770B | 公開(公告)日: | 2022-01-04 |
| 發明(設計)人: | 張穎;顧高翔;劉杰;吳佳玲;郭鵬;朱萬明;宮龍 | 申請(專利權)人: | 上海世脈信息科技有限公司 |
| 主分類號: | G08G1/01 | 分類號: | G08G1/01;G06F16/29 |
| 代理公司: | 上海申匯專利代理有限公司 31001 | 代理人: | 翁若瑩;柏子雵 |
| 地址: | 200040 上海市靜安區滬太支路536,5*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 數據 環境 公交 載客 實時 分析 預測 方法 | ||
1.一種大數據環境下公交載客量實時分析預測方法,其特征在于,包括以下步驟:
步驟1、獲取在時間和空間上都連續的公交車GPS數據,公交車GPS數據包括公交線路編號LID、公交車編號BID、通信動作發生時刻TIME1、公交車所在經度位置Long和公交車所在緯度位置Lat,不同的公交車對應不同的公交線路編號LID和公交車編號BID,提取每個公交車編號BID所對應的公交車在指定時間段內的GPS數據,構成每個公交車的公交車出行時空序列;
步驟2、獲取匿名加密的公交刷卡記錄數據,在時間順序上,每刷卡一次就產生一條公交刷卡記錄數據,每條公交刷卡記錄數據包括IC編號ICID、公交線路編號LID、公交車編號BID、通信動作發生時刻TIME2、上下車類型TYPE及乘車花費COST,不同掃碼終端或IC卡對應不同的IC編號ICID,不同IC編號ICID對應不同個體,提取每個IC編號ICID在指定時間段內的公交車刷卡記錄,構成不同IC編號ICID所對應個體的刷卡數據集;
步驟3、獲取指定空間范圍內所有公交線路的公交站點,采用空間聚類算法對所有公交站點進行聚類,合并空間位置臨近的公交站點作為可能出現的換乘節點,對所有公交線路中的公交站點進行調整,用聚類后的公交站點替換聚類前的公交站點,以便對后續個體的換乘行為進行提取;
步驟4、對步驟2得到的所有個體的刷卡數據集進行整理,獲得所有個體的所有上、下車站點信息,形成所有個體的完整乘客公交刷卡時序數據,對于當前個體所對應的刷卡數據集中的當前公交刷卡記錄數據而言,獲取當前通信動作發生時刻TIME2公交車的空間位置,從而獲得當前公交刷卡記錄數據的上車站點信息,并添加到當前公交刷卡記錄數據中;
步驟5、將公交刷卡方式分為三種:上下車均刷卡、上車后分段刷卡和上車后單價刷卡,針對不同的刷卡方式,分別對個體的上下車時間和地點進行分析判斷,包括以下步驟:
步驟5.1、順序遍歷所有IC編號ICID對應的完整乘客公交刷卡時序數據,讀取其公交刷卡記錄數據,依照公交線路編號LID將其刷卡時序拆分;
步驟5.2、針對每個IC編號ICID中的每條公交線路,判斷其刷卡形式,根據不同的刷卡方式采用不同的方法統計個體在當前公交線路上的上下車信息,推斷其下車點是否可以推算,包括以下步驟:
步驟5.2.1、針對當前IC編號ICID,讀取其每次乘坐公交車的上車站點信息、公交線路編號LID和上車時間,即通信動作發生時刻TIME2;
步驟5.2.2、針對不同公交線路不同的刷卡方式,采用不同的方法估算當前IC編號ICID在每次乘坐公交車的下車信息;
若當前公交線路的刷卡方式為上下車均要刷卡,則公交掃碼終端或IC卡中涉及當前公交線路的刷卡記錄中均已包含了每次乘坐當前公交線路的公交車的下車信息,因此,針對當前IC編號ICID獲取其所有的已知下車點記錄,包括以下步驟:若其在當前公交線路上有刷卡記錄數據R1,且根據刷卡記錄數據R1中的上下車類型TYPE判斷對應的公交站點S1為上車站點,則判斷刷卡記錄數據R1的下一條刷卡記錄數據R2中的上下車類型TYPE是否為下車,若是,則刷卡記錄數據R2對應的公交站點S2為下車站點,將刷卡記錄數據R1和刷卡記錄數據R2合并,標為已知下車點記錄,若刷卡記錄數據R2中的上下車類型TYPE為上車,則表明當前IC編號ICID在上一趟行程中沒有下車刷卡,則廢棄刷卡記錄數據R1,重新獲取下一條刷卡記錄數據進行判斷;
若當前公交線路的刷卡方式為上車刷卡,且分段計費,則獲取所有IC編號ICID所有可推算下車點的記錄及無法推算下車點的記錄,包括以下步驟:
若當前IC編號ICID在時間段T1期間在當前公交線路上有刷卡記錄數據R3,對應的公交站點為S3,則:
步驟5.2.2.1、根據刷卡記錄數據R3的乘車花費COST推算乘客可能的下車站點區間;
步驟5.2.2.2、讀取刷卡記錄數據R3的下一條刷卡記錄數據R4,若刷卡記錄數據R4對應的起始公交站點S4在步驟5.2.2.1推算得到的下車站點區間中,則認為當前IC編號ICID乘坐當前公交線路的公交車的下車站點即為S4,同時將刷卡記錄數據R3記錄為可推算下車點的記錄;若刷卡記錄數據R4對應的起始公交站點S4不在步驟5.2.2.1推算得到的下車站點區間之內,則將刷卡記錄數據R3記錄為無法推算下車點的記錄;
若當前公交線路的刷卡方式為上車刷卡,且統一計費,則獲取所有IC編號ICID所有可推算下車點的記錄及無法推算下車點的記錄,包括以下步驟:
若當前IC編號ICID在時間段T1期間在當前公交線路上有刷卡記錄數據R5,刷卡記錄數據R5對應的上車公交車站為S5,讀取刷卡記錄數據R5的下一條刷卡記錄數據R6:
若刷卡記錄數據R6中的起始公交站點S6在當前公交線路從刷卡記錄數據R5出發后的沿線車站中,且刷卡記錄數據R6的通信動作發生時刻TIME2與當前公交線路到起始公交站點S6時間的差值在閾值范圍T_Thrh內,則認為當前IC編號ICID在起始公交站點S6下車,同時將刷卡記錄數據R5記錄為可推算下車點的記錄;
若刷卡記錄數據R6中的起始公交站點S6不在當前公交線路從刷卡記錄數據R5出發后的沿線車站中,則將刷卡記錄數據R6記錄為無法推算下車點的記錄;
統計當前IC編號ICID在當前公交線路中所有的上車點出現的頻次,作為不可推算下車點統計的依據;
步驟6、針對每個IC編號ICID所對應的個體,統計出個體一周每天分時段乘坐每條公交線路的概率,及其在上車之后在沿途各站點下車的概率,獲得其出行O-D路段的概率分布,具體包括以下步驟:
步驟6.1、針對每個IC編號ICID,統計其在指定時間段內在特定時段T搭乘公交線路L的次數,設IC編號ICID號為IC1的公交掃碼終端或IC卡,其在時間段T內在公交車站S乘坐公交線路L的概率為P_U(T,S,L,IC1)即為N_U(T,S,L,IC1)/N_Day,式中:N_U(T,S,L,IC1)為指定時間段內IC1在每天的時間段T內在公交車站S上車乘坐公交線路L的次數,N_Day為時間段T內的天數N_Day;
步驟6.2、在步驟5獲得的對每趟乘車記錄下車點估算的基礎上,針對各公交線路不同的刷卡方式采用不同的方法統計個體在各個公交站點的下車概率;
若公交線路L的刷卡方式為上下車均要刷卡,則統計IC1在指定時間段T內在T1時段內在公交車站S1上車的條件下在沿途各車站下車的次數,則IC1在時間段T1內在公交車站S1上車乘坐公交線路L后,在公交站點S2下車的概率為N_D(S1,S2,L,IC1)/N_U(T1,S1,L,IC1),式中,N_U(T1,S1,L,IC1)為指定時間段內IC1在時間段T1內在公交車站S1上車乘坐公交線路L的次數,N_D(S1,S2,L,IC1)為IC1在T1時間段內從公交車站S1上車乘坐公交線路L后在其沿線公交車站S2下車的頻次;
若公交線路L的刷卡方式為上車刷卡,且分段計費,則對下車點的頻次視其刷卡記錄的下車點是否可推算分開統計:對于不可推算下車點的記錄,假設一個IC編號ICID乘坐公交車一般具有連續性,即其上車點是其另一趟出行的下車點,因此統計當前IC編號ICID在公交線路L中所有的上車點出現的頻次,作為不可推算下車點統計的依據:
對于可推算下車點的記錄,統計IC1在T1時間段內從公交車站S3上車乘坐公交線路L后在其沿線公交車站S4下車的頻次N_D(S3,S4,D,L,IC1),則IC1在時間段T1內從公交車站S3乘坐公交線路L到公交車站S4下車的概率即為N_D(S3,S4,D,L,IC1)/N_U(T1,S3,L,IC1),式中:N_U(T1,S3,L,IC1)為指定時間段內IC1在時間段T1內在公交車站S3上車乘坐公交線路L的次數;
對于不可推算下車點的記錄,統計IC1乘坐公交線路L的歷史記錄中在公交車站S4的上車頻次N_U(S4,L,IC1),則IC1在時間段T1內在公交車站S3搭乘公交線路L后,其在剩余路線上公交車站S4下車的概率為N_U(S4,L,IC1)/sum(N_U(SN,L,IC1)),式中,SN為IC1在公交車站S3上車后公交線路L剩余路徑上的站點集合,sum(N_U(SN,L,IC1))為IC1在公交車站S3上車后在剩余路徑上的站點上車的頻次,用于替代下車的頻次;
若公交線路L的刷卡方式為上車刷卡,且統一計費,則對下車點的頻次視其刷卡記錄的下車點是否可推算同樣需要分開統計:
對于可推算下車點的記錄,統計IC1在時間段T1內從公交車站S5上車乘坐公交線路L后在其沿線的公交車站S6下車的頻次N_D(S5,S6,L,IC1),則IC1在時間段T1內從公交車站S5乘坐公交線路L到公交車站S6下車的概率即為N_D(S5,S6,L,IC1)/N_U(T1,S5,L,IC1),式中:N_U(T1,S5,L,IC1)為指定時間段內IC1在時間段T1內在公交車站S5上車乘坐公交線路L的次數;
對于不可推算下車點的記錄,統計IC1乘坐公交線路L的歷史記錄中在公交車站S6的上車頻次N_U(S6,L,IC1),則IC1在時間段T1內在公交車站S5搭乘公交線路L后,其在剩余路線上的公交車站S6下車的概率為N_U(S6,L,IC1)/sum(N_U(SN,L,IC1)),式中,SN為IC1在公交車站S5上車后公交線路L剩余路徑上的站點集合,sum(N_U(SN,L3,IC1))為IC1在公交車站S5上車后在剩余路徑上的站點上車的頻次,用于替代下車的頻次;
步驟6.3、根據步驟6.2獲得的三種刷卡方式下對于可推算下車點和不可推算下車點的刷卡記錄中對于各站點下車概率的統計,采用記錄數加權的方式獲得IC1在時間段T1內在公交車站S上車后再在公交車站SS下車的概率:
對于上下車均要刷卡的公交線路,所有的有效記錄均有完整的上下車信息,因此步驟6.2.1獲得的就是最終的IC1在時間段T1內在公交車站S上車后在公交車站SS下車的概率P_D(T1,S,SS,L,IC1);
對于只有上車刷卡的公交線路,其刷卡記錄判斷分為下車點可推斷何不可推斷兩種,分別統計可推算下車點的記錄和不可推算下車點的記錄的數量N_C(T1,S,L,IC1)和N_NC(T1,S,L,IC1),以及總記錄數N(T1,S,L,IC1)=N_C(T1,S,L,IC1)+N_NC(T1,S,L,IC1),采用記錄數加權模式,IC1在時間段T1內搭乘公交線路L在公交車站S上車后再在公交車站SS下車的概率P_D(T1,S,SS,L,IC1)=N_D(T1,S,SS,L,IC1)/N_U(T1,S,L,IC1)*N_C(T1,S,L,IC1)/N(T1,S,L,IC1)+N_U(SS,L,IC1)/sum(N_U(SN,L,IC1))*N_NC(T1,S,L,IC1)/N(T1,S,L,IC1),其中,N_D(T1,S,SS,L,IC1)為IC1在T1時間段內從公交車站S上車乘坐公交線路L后在其沿線公交車站SS下車的頻次;N_U(T1,S,L,IC1)為指定時間段內IC1在時間段T1內在公交車站S上車乘坐公交線路L的次數;N_U(SS,L,IC1)為IC1乘坐公交線路L的歷史記錄中在公交車站SS的上車頻次;sum(N_U(SN,L,IC1))表示IC1在公交車站SN上車后在公交線路L的剩余路徑上的站點上車的頻次;
步驟6.4、遍歷所有IC編號ICID,獲取對應的每個個體在時間段T1內在公交車站S站點搭乘公交線路L的概率,以及其后在沿途每個公交車站下車的概率;以及以此為基礎計算每個個體在時間段T1內在公交車站S搭乘所有公交線路的概率,以及其后在沿途每個公交車站下車的概率;以及以此為基礎計算每個個體在時間段T1內在所有公交車站搭乘所有公交線路的概率,以及其后在沿途每個公交車站下車的概率;最終計算得到每個個體在一天的所有時段內在所有公交車站搭乘所有公交線路的概率,以及其后在沿途每個公交車站下車的概率;
步驟7、從數據源獲得實時公交刷卡數據,以及每條公交線路上每輛車的GPS數據,挖掘公交線路潛在乘客的乘車情況,依據步驟6獲得的出行O-D路段的概率分布計算每條公交線路中每輛車可能的實時載客量和擁擠程度,對未來指定時間段內公交車的載客需求和擁擠程度進行預測,所述步驟7包括:
步驟7.1、從數據源獲得時間區間為TM的實時公交刷卡數據和公交車GPS數據,對刷卡記錄數據進行整理,依照公交線路編號LID和IC編號ICID進行分類排序;
步驟7.2、讀取每個IC編號ICID的最后一條刷卡記錄數據,獲得當前IC編號ICID乘坐的公交線路編號LID、公交車編號BID、上下車類型TYPE,依據步驟4的方法,通過公交車GPS數據獲取當前IC編號ICID的上車站點信息,然后根據不同的公交線路刷卡方式判斷其在當前時間節點的乘車狀況:
若當前公交線路為上下車均刷卡,且當前IC編號ICID中最后的刷卡記錄數據為下車,則認為當前IC編號ICID當前沒有乘坐公交車,則其實時乘坐當前公交線路中的公交車的期望為0;
若當前公交線路為上下車均刷卡,且當前IC編號ICID中最后的刷卡記錄數據為上車,則認為當前IC編號ICID當前乘坐當前公交線路中的公交車,則其實時乘坐當前公交線路中的公交車的期望為1;
若當前公交線路為上車刷卡,則根據步驟6獲得的每個ICID在其上車時間即通信動作發生時刻TIME2的時間段內在公交車站SL乘坐當前公交線路的公交車后,在沿途各站下車的概率,依據GPS數據獲取當前公交車當前的公交車站位置,計算當前IC編號ICID在當前公交車站SN仍未下車的概率,概率值為1減去當前IC編號ICID在公交車站SL和公交車站SN之間的公交車站SM下車的概率之和PT(TR,SN,L,ICID)=1-sum(P_D(TU,SL,SM,L,ICID)),TR表示實時,則當前IC編號ICID實時乘坐公交線路中的公交車的期望為E(TR,L,ICID)=PT(TR,SN,L,ICID);
步驟7.3、針對每輛公交車,統計所有最后一次刷卡行為發生在當前公交車的當前IC編號ICID的實時乘坐當前公交車的期望,其期望之和即為當前公交車實時搭載人數的期望;
步驟7.4、根據步驟6獲得的每個IC編號ICID分時段分站點乘坐公交車的概率,從實時向后預測指定時間段TPJ內每趟公交車線路在站點之間的載客需求期望,包括以下步驟:
步驟7.4.1、根據公交車的GPS數據和其發車安排,首先預測每趟公交線路在TPJ時間段內發車情況和每輛公交車停靠各公交車站的時間區間;
步驟7.4.2、針對每輛公交車,遍歷所有IC編號ICID,查找在指定時間段TPJ內在其后續沿途各站點中有上車記錄的IC編號ICID;
步驟7.4.3、針對步驟7.4.2得到的每個IC編號ICID,根據其在時間段T內在公交車站S上車的概率P_U(T,S,L,ICID),計算每個IC編號ICID在時間段T內在公交車站S乘坐公交車的期望,根據已在車中的乘客在公交車站S的下車概率P_D_prj(TU,SL,S,L,ICID),計算每個可能已經乘坐當前公交車的乘客在時間段T在公交車站S下車的期望;由于在載客量的預測中,對于預測的IC編號ICID是否上車是一個概率分布,和實時載統計不同,因此在上車行為為預測的乘客在公交車站S的下車概率為乘客在公交車站SL上車的概率和在公交車站S下車概率的乘積:P_D_prj(TU,SL,S,L,ICID)=P_U(TU,SL,L,ICID)*P_D(TU,SL,S,L,ICID),當前IC編號ICID在公交車站S下車的期望為E_D(T,S,L,ICID)=P_D_prj(TU,SL,S,L,ICID);
步驟7.4.4、遍歷每個IC編號ICID,對其在時間段T在公交車站S上車的期望求和,即為當前公交車在公交車站S的期望上客量,對每個IC編號ICID在公交車站S下車的期望求和,即為當前公交車在公交車站S的期望下客量,兩者相減即為預測得到的時間段T內的當前公交車的期望載客量;
步驟7.5、獲取每輛公交車的設計荷載人數數據,將其與分時段每輛公交車的期望載客量比較,獲得分時段每輛公交車的實時期望擁擠程度統計和預測結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海世脈信息科技有限公司,未經上海世脈信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810860244.5/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種信息管理系統
- 下一篇:一種智慧化交通路網系統
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





