[發明專利]一種基于機器學習的地鐵短時客流預測方法有效
| 申請號: | 201710573357.2 | 申請日: | 2017-07-14 |
| 公開(公告)號: | CN107291668B | 公開(公告)日: | 2018-08-17 |
| 發明(設計)人: | 王璞;凌溪蔓 | 申請(專利權)人: | 中南大學 |
| 主分類號: | G06F17/18 | 分類號: | G06F17/18;G06N99/00;G06Q10/04 |
| 代理公司: | 長沙市融智專利事務所 43114 | 代理人: | 歐陽迪奇 |
| 地址: | 410083 湖南*** | 國省代碼: | 湖南;43 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 機器 學習 地鐵 客流 預測 方法 | ||
1.一種基于機器學習的地鐵短時客流預測方法,其特征在于,包括以下步驟:
步驟一:獲取待統計的地點區間內的所有地鐵刷卡記錄;
步驟二:根據步驟一的地鐵刷卡記錄,以乘客連續兩次的進出站刷卡記錄分別為一次出行的O和D,統計每日的乘客的出行OD,求出每日的地鐵客流的OD分布;
步驟三:按照步驟二求出的OD分布,統計每日待統計的地點區間內所有地鐵區間在單位時間窗內的客流;同時,由步驟一中的地鐵刷卡記錄直接統計得到每日地鐵所有站點在單位時間窗內的客流;
步驟四:構建地鐵客流網絡G,以單位時間窗內的地鐵站點客流為節點,以單位時間窗內的地鐵區間客流為邊的權重,建立地鐵客流網絡G;
步驟五:對于待統計的地點區間內的每一個目標地鐵區間,以步驟四中所建立的地鐵客流網絡G中的所有節點和邊作為其備選特征,取特征訓練數據集D={(x1,y1),(x2,y2),…,(xn,yn)},xi∈Rd,y∈R,矩陣X=(x1,x2,…,xn)T表示訓練集樣本的x輸入,xi∈Rd,其中R表示實數,d表示維數,矩陣y=(y1,y2,..,yn)T表示訓練集樣本的y輸入,yn與xn對應,構成一個樣本,n為樣本數,利用遞歸特征消除算法作為特征選擇方法,找出目標時間窗內對每一目標地鐵區間影響最大的前K個特征;
步驟六:利用梯度提升回歸樹方法建立回歸預測模型,將步驟五中挑選出的對目標區間影響最大的前K個特征,作為回歸模型的輸入,納入后續的回歸預測,此時輸入的樣本xi的維數是K維,目標值列矩陣y=(y1,y2,..,yn)T與特征選擇方法中的目標值一致;
所述的步驟五中,所述的遞歸特征消除算法包括以下步驟:
步驟1:初始化:原始特征集合S={1,2,…,d},特征排序集
步驟2:當S不為空時,執行步驟3,否則結束遞歸特征消除算法并輸出特征排序集F;
步驟3:獲取候選特征集合的訓練樣本即訓練數據集:D={(x1,y1),(x2,y2),…,(xn,yn)},xi∈Rd,d∈S,y∈R,作為輸入;
步驟4:利用線性回歸模型:yi=ω0+ω1xi1+ω2xi2+…+ωdxid,得到每個特征的重要程度,即線性回歸模型的系數ωk,k=1,2,…,d;
步驟5:找出排序準則分數最小的特征p=arg minkωk,ωk表示第k個特征的排序準則分數即重要程度,此時對應線性回歸的中的權重系數,p表示當前排序準則分數最小的特征,arg minkωk表示整個函數取最小值時,自變量k的取值,即p;
步驟6:更新特征集F={p}∪F;
步驟7:在S中去除特征S=S/p,返回步驟2。
2.根據權利要求1所述的一種基于機器學習的地鐵短時客流預測方法,其特征在于,所述的步驟一中,地鐵刷卡記錄只選擇所有包括完整出行OD的地鐵刷卡記錄。
3.根據權利要求1所述的一種基于機器學習的地鐵短時客流預測方法,其特征在于,所述的步驟二中,以乘客的出行OD為最短路徑出行OD。
4.根據權利要求1所述的一種基于機器學習的地鐵短時客流預測方法,其特征在于,所述的步驟六中,所述的梯度提升回歸樹方法包括以下步驟:
步驟1:初始化估計一個使損失函數極小化的常數值,其中常數值c要使得的值最小,即c和yi接近,此時f0(x)是只有一個節點的樹;
步驟2:迭代地建立M棵提升樹,以訓練數據集D={(x1,y1),(x2,y2),…,(xn,yn)},x∈RK,y∈R作為輸入,其中矩陣X=(x1,x2,…,xn)T表示訓練集樣本的x輸入,xi∈RK,其中維數為K維,列矩陣y=(y1,y2,..,yn)T表示訓練集樣本的y輸入,yn與xn對應,構成一個樣本,n為樣本數;計算損失函數的負梯度在當前模型的值其中i=1,…,N,為求導符號,N為迭代次數,并將它作為殘差的估計值;
步驟3:對于rmi擬合一棵回歸樹,得到第m棵樹的葉節點區域Rmj,j=1,2,…,J,J為葉子節點個數;對每個葉子節點循環;
步驟4:利用線性搜索估計葉節點區域的值使損失函數極小化,更新其中Rmj表示第m棵樹的葉節點區域;
步驟5:即為最終的模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中南大學,未經中南大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710573357.2/1.html,轉載請聲明來源鉆瓜專利網。





