[發明專利]一種低通信開銷的宏觀交通規律建模方法有效
| 申請號: | 202010600814.4 | 申請日: | 2020-06-28 |
| 公開(公告)號: | CN111833601B | 公開(公告)日: | 2022-05-20 |
| 發明(設計)人: | 趙龍;劉子珩;鄭侃 | 申請(專利權)人: | 北京郵電大學 |
| 主分類號: | G08G1/01 | 分類號: | G08G1/01;G06F30/27;G06K9/62 |
| 代理公司: | 北京中海智圣知識產權代理有限公司 11282 | 代理人: | 楊樹芬 |
| 地址: | 100876 北京市海淀區西*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 通信 開銷 宏觀 交通 規律 建模 方法 | ||
1.一種低通信開銷的宏觀交通規律建模方法,其特征在于,包括以下步驟:
步驟1,由精確樣本集合訓練模型并得到重要性閾值;
步驟1.1,首先構造精確樣本集合,為了一次性預測出N條路段的擁堵指數,對原始數據的格式進行了處理,以滿足隨機森林模型的輸入和輸出格式,表示使用過去T時間內的數據來預測當前t時刻的擁堵指數,數據最小顆粒度為Δt,即每條數據表示Δt時間內該路段的擁堵指數,將t-T時刻到t-Δt時刻的T/Δt條數據橫向拼接作為一條輸入數據,輸出則是t時刻的數據,依此類推,每次選取T/Δt條數據重構為一個樣本,即輸入矩陣X的維度是T/Δt×(N×T/Δt),輸出標簽Y的維度是T/Δt×N,輸入矩陣X的構造方式導致同一路段的特征重復出現,則用表示路段r第j次出現的特征,其中:r=1,2,…,N,j=1,2,…,T/Δt,在計算最后的路段特征重要性時需要對相同路段進行合并;
步驟1.2,考慮到特征穿越問題,按照時間順序將樣本按照3:1劃分訓練集和測試集;
步驟1.3,使用構造的精確樣本訓練集訓練隨機森林模型,依據隨機森林中多棵回歸樹的節點分叉時所選擇的特征及損失下降值,能夠計算特征重要性并直觀地比較路段重要性大小關系,下面是特征重要性的計算方法:
a,設當前回歸樹的節點是m,當前節點的樣本集合是Nm={yi}且|Νm|=Nm,那么樣本平均值為:
b,當前節點m的誤差為
c,當前節點與子節點c的誤差變化量為IMm=εm-εc;
d,當特征在決策樹k中出現的節點在集合M中,那么在第k棵樹中的重要性為
e,假設n表示隨機森林中樹的個數,那么特征在隨機森林中的重要性為:
f,將N×T/Δt個特征進行歸一化,得到樣本中所有特征的重要性為:
g,將樣本中相同路段的特征重要性相加,合并為N個特征,得到:
步驟1.4,訓練好模型后用測試集進行模型性能測試,發送的數據量越大則模型預測準確率越高,預測誤差也就越低,發送數據量和誤差是一個負相關,為確定最優發送路段數的具體值,提出通信學習效率的概念,使得數據路段上傳個數和誤差得到平衡,通信學習效率η定義為預測擁堵指數有用功率的方根與發送路段數線性值的比值,即其中,表示擁堵指數的預測值,表示真實值和預測值的絕對誤差,N表示預測擁堵指數的路段個數,系數a和b根據通信系統模型可變,根據N0=argmaxη計算最優的發送路段數;
步驟2,用殘缺和污染樣本集合訓練模型并測試得到污染程度;
步驟2.1,得到了重要性閾值,能夠構造殘缺樣本集合,通過設定閾值V來判斷是否發送路段數據,當路段的重要性Ir≥V時,發送路段數據,否則不發送路段數據,即在測試樣本相應位置進行填0處理,接下來構造污染樣本集合;
步驟2.2,道路交通數據在時間上具有一定的周期性,把全部數據按照工作日和周末分為兩類,分別找到交通擁堵指數的全天變化趨勢,計算出變化趨勢的平均值,用實際值減去均值求得偏差Bi=yi-mi,,其中,Bi是真實值與平均值的差,mi是數據的平均值;均值能夠事先計算得到并存儲在網絡服務器中,則只需對偏差進行量化編碼,假設量化區間為[s,e],量化比特位數為b,則量化區間長度l為l=(e-s)/2b,量化區間可變,則規定超出量化區間的值歸于量化區間的最外段,即:
其中,qBi表示對偏差Bi進行量化后的值,服務器端解碼后直接與均值相加便可恢復原始數據,即qi=qBi+mi,其中,qi表示進行偏差量化后得到的數據量化值,這樣就得到了污染樣本集合,由量化區間的選取與量化位數的大小共同決定污染程度;
步驟2.3,再用污染樣本集合訓練模型并進行性能測試以確定污染程度,根據計算偏差Bi取值范圍在[-35,35]之間,則設置量化區間初始值s=-35,e=35,并逐漸縮小量化區間;
步驟3,傳感器或車輛上傳數據并進行預測,在進行道路交通擁堵指數實時預測時,傳感器或車輛能夠接收來自網絡服務器發送的重要性閾值V以及量化區間和最優量化位數,當路段的重要性Ir≥V時,發送路段數據,否則不發送路段數據,當發送路段數據,則計算實際值與平均值的偏差,將偏差按照量化區間和最優量化位數進行均勻量化,上傳給網絡服務器,網絡服務器根據訓練好的模型進行道路交通擁堵指數預測。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京郵電大學,未經北京郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010600814.4/1.html,轉載請聲明來源鉆瓜專利網。





