[發明專利]一種考慮多因素影響的日維度區域交通指數預測方法有效
| 申請號: | 201710955116.4 | 申請日: | 2017-10-13 |
| 公開(公告)號: | CN107610469B | 公開(公告)日: | 2021-02-02 |
| 發明(設計)人: | 翁劍成;邸小建;林鵬飛;王晶晶;付宇;毛力增 | 申請(專利權)人: | 北京工業大學 |
| 主分類號: | G08G1/01 | 分類號: | G08G1/01;G06Q10/04 |
| 代理公司: | 北京思海天達知識產權代理有限公司 11203 | 代理人: | 沈波 |
| 地址: | 100124 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 考慮 因素 影響 維度 區域 交通 指數 預測 方法 | ||
1.一種考慮多因素影響的日維度區域交通指數預測方法,其特征在于:該方法具體包括如下步驟:
步驟1,劃分并聚合交通區域;
步驟1.1,基于路網結構劃分交通小區;
綜合考慮用地性質、行政區劃、自然地貌、道路網結構因素,將分析區域劃分為若干個交通小區;劃分交通小區時要考慮到城市內外環區域交通需求差別大,交通需求大的區域劃分面積小,而交通需求小的區域面積隨之增加;
步驟1.2,基于空間自相關分析的交通小區聚合;
為增強區域路網運行狀態評價的針對性和準確性,對瑣碎的交通小區合并,將路網運行狀態相似的區域采用空間自相關劃分方法進行區域聚合;利用局部莫蘭指數作為局部空間自相關檢驗指標,識別區域內運行狀態的集聚性質,即根據性質相似性準則實現交通小區的空間聚類;
步驟2,確定區域交通指數相關預測參數;
預測時間間隔和預測周期是交通預測中的重要參數;預測時間間隔代表交通狀態變化的數據系列的最小時間單位;區域交通指數預測的目的在于提前預知下一周區域路網整體運行狀態的整體趨勢,在交通高峰時期準確識別路網運行壓力大的區域,以便提前制定相應疏堵措施;因此,應綜合考慮預測模型在實際應用中的效率和精度需求,確定區域交通指數的預測時間間隔和預測周期;
步驟3,區域交通指數原始數據預處理;
步驟3.1,計算區域交通指數;
具體計算步驟如下:
S1.計算區域交通初始指數Rm:以不長于15分鐘為統計間隔,計算區域m通過各等級路段的自由流速度與實際平均行駛速度的比值;參考路段交通運行等級劃分標準,分別統計全路網和區域m路網中各等級道路處于嚴重擁堵等級的路段里程,以區域m路網中嚴重擁堵里程占比作權重,按照公式(1)計算得到該區域交通初始指數Rm;
式中,α代表時間段;M代表區域數量;p代表區域m內的路段數量;Lαm代表α時段內區域m內路網中處于嚴重擁堵等級的路段里程;代表α時段內通過區域m內p個路段的自由流速度;代表α時段內通過區域m內p個路段的實際平均速度;
S2.計算區域交通指數RTI:在對Rm一段時期的數據積累后,按照公式(2)對區域交通指數預指數進行歸一化處理,最終得到值域范圍屬于[0,10]的區域交通指數RTI;
式中,RTI代表區域交通指數;Rm代表區域交通初始指數;Rmin代表歷史區域交通指數數據系列中區域交通初始指數的最小值,Rmax代表歷史數據系列中區域交通初始指數的最大值;
步驟3.2,原始數據彌補缺失值;
原始數據彌補缺失值的規則如下:
S1.從原始數據中提取出缺失比例小于等于15%的數據系列,對其中的間斷部分進行彌補處理;
S2.單個時間點數據缺失的情況下,采用前后相鄰兩個時間點數據的算數平均值作為恢復數據;
S3.多個連續時間點數據缺失的情況下,提取前i周同期對應歷史數據RTIi,wi表示RTIi對應的權重,丟失區域交通指數數據RTId的計算公式為:
式中,0<wi≤1,從時間遠近相互關聯程度看,各權重之間應滿足如下關系:wi+1<wi且i不超過3;
步驟3.3,原始數據剔除異常值;
原始數據剔除異常值的規則如下:
S1.計算數據系列中每個時刻指數數值的前差和后差;
B1_t=RTIt-RTIt-1 (4)
B2_t=RTIt+1-RTIt (5)
式中,B1_t代表某時刻指數數值的前差;B2_t代表某時刻指數數值的后差;RTIt代表當前某一時刻區域交通指數;RTIt-1代表前一時刻區域交通指數;RTIt+1代表后一時刻區域交通指數;
S2.計算每個時刻指數數值的波動指數;
式中,Z代表某時刻指數數值的波動指數;B1_t代表該時刻指數數值的前差;B2_t代表該時刻指數數值的后差;
S3.根據步驟3.3中的S2計算得到的Z值判斷該數值是否為奇異值,取15%作為判定界限,若Z>15%,則該數值是奇異值,并做剔除;
步驟3.4,區域交通指數分級處理;
將區域交通指數用以下閾值劃分原則將樣本分為5類,分別是暢通:0≤RTI<2、基本暢通:2≤RTI<4、輕度擁堵:4≤RTI<6、中度擁堵:6≤RTI<8、嚴重擁堵:8≤RTI≤10;分類結果用于決策樹的擁堵狀態等級預測,指數數據用于以上分類完成后利用歐氏距離進行交通指數預測;
步驟3.5,構建訓練樣本集;
由于區域交通指數的變化受多種因素影響,因此首先需要為訓練樣本集確定因素屬性集;將因素屬性集分為區域屬性、日期屬性、天氣屬性和事件屬性;其中日期屬性和天氣屬性為影響路網運行狀態的全局性因素,而區域屬性和事件屬性是特定區域有可能發生的局部性因素;日期屬性因素包括月份、時段、工作日、節假日、星期、學生假期、尾號限行;天氣屬性因素主要有雨、雪、霾等;事件屬性因素包含特殊事件、大型活動、交通管制;對收集的影響因素基礎數據進行標準格式化處理,并將影響因素屬性集與預處理后的交通指數數據集整合作為訓練樣本集;
步驟4,構建區域交通指數預測模型
步驟4.1,區域路網運行擁堵狀態等級預測;
通過步驟3.5構建的訓練樣本集來生成區域交通指數決策樹,過程主要包括劃分選擇過程、區域交通指數決策樹的更新和區域路網運行狀態等級預測過程;
(1)將區域指數樣本遞歸劃分進行建樹過程
①設結點的訓練數據集為D,計算各個因素的基尼指數,包括區域屬性、日期屬性、天氣屬性和事件屬性;此時,對每一個特征屬性A,對其可能取的每個值a,根據樣本點對A=a的測試為“是”或“否”將D分割成D1和D2兩部分,利用公式(7)和公式(8)計算A=a時的基尼指數;
式中,Gini(D)代表集合D的不確定性;K代表類別總數;k代表類別序號數;pk代表樣本點屬于第k類的概率;
式中,Gini(D,A)代表經A=a分割后集合D的不確定性;
②在所有可能的特征屬性A以及它們所有可能的切分點a中,選擇基尼指數最小的特征及其對應的切分點作為最優特征與最優切分點;并從現結點生成兩個子結點,將訓練數據集依特征分配到兩個子結點中去;
③對兩個子結點遞歸地調用①,②,直至滿足停止條件;
④生成CART決策樹;
⑤設置一個葉子節點需要的最小樣本數量,或者樹的最大深度,避免過擬合;
(2)區域交通指數決策樹的更新
模型的精度受天氣預報的準確性影響較大,歷史數據的及時更新有助于提升模型精度,因此本方法提出動態更新區域交通指數歷史訓練庫的完善機制;訓練庫中,一方面為了提高算法運算速度僅選擇與預測周期前n個月份的歷史數據并始終保留具有特殊屬性值的歷史數據;另一方面在預測第j個周期前,將j-1周期的真實天氣情況進行更新;
(3)輸入預測時間段內各個屬性值,進行擁堵狀態等級預測
收集下周尾號限行、天氣情況、大型活動及交通管制各類屬性信息,利用生成的區域交通指數決策樹進行預測,得到預測時間段內交通運行狀態等級的粗分類結果;在劃分選擇過程中,需要確定劃分的標準,即確定屬性變量的臨界值
步驟4.2,利用平方歐式距離進行區域交通指數預測;
利用平方歐氏距離篩選與當前預測狀態最為相似的歷史狀態下的區域交通指數;定義Y{y1,y2,...,yq}為當前預測狀態向量,將粗分類相同的歷史狀態向量組成集合Xs{XS1,Xs2,...,Xsq};因此,歷史狀態向量與預測狀態向量之間的平方歐氏距離計算公式如下所示:
式中,Cs代表具有相同粗分類結果的第s個歷史狀態與預測狀態的平方歐氏距離;Xsq代表具有相同粗分類結果的數據集X中的第s個歷史狀態向量中第q個屬性的值;yq代表預測狀態向量Y中的第q個屬性的值;q=1,2,...,Q,q為正整數;
取平方歐式距離小于閾值c的區域交通指數,組成集合V{V1,V2,...VL};閾值c為歐氏距離的第c位百分位數,此時區域交通指數預測值與實際值的平均絕對誤差最??;
最終預測的區域交通指數為:
式中,Pf代表預測指數值;L為集合V中的數據數量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京工業大學,未經北京工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710955116.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種智能大巴管理系統
- 下一篇:一種交通擁堵評價方法和裝置





