[發明專利]基于最大似然回歸樹的地鐵事故延誤時間預測方法有效
| 申請號: | 201810915093.9 | 申請日: | 2018-08-13 |
| 公開(公告)號: | CN109447306B | 公開(公告)日: | 2021-07-02 |
| 發明(設計)人: | 翁金賢;于堯;馮琳 | 申請(專利權)人: | 上海海事大學 |
| 主分類號: | G06Q10/04 | 分類號: | G06Q10/04;G06Q50/26 |
| 代理公司: | 上海互順專利代理事務所(普通合伙) 31332 | 代理人: | 成秋麗 |
| 地址: | 201306 上海市*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 最大 回歸 地鐵 事故 延誤 時間 預測 方法 | ||
1.一種基于最大似然回歸樹的地鐵事故延誤時間預測方法,其特征在于包括以下步驟:
步驟一:收集處理歷史數據:
(1)確定研究對象,即城市或區域;
(2)規定研究數據的統計期;
(3)收集地鐵事故延誤相關數據;
(4)將數據按照地鐵事故發生的日期、地鐵線路、事故起因以及地鐵事故延誤時間多個類別進行分類梳理,得到地鐵事故延誤的自變量:地鐵事故發生日期、發生時間、供電故障、車門故障、車輛故障、緊急事件、信號故障、與墜落物或乘客發生碰撞、軌道故障、操作故障,以及地鐵事故延誤因變量;
步驟二:描述性統計分析:
(1)對地鐵事故延誤的總體樣本數據進行描述統計,確定數據的集中趨勢、離散程度,確定數據的分布形式;
(2)對各自變量影響下的地鐵事故延誤數據進行描述統計;
(3)對各自變量進行顯著性檢驗,為模型建立變量的選取和分析奠定基礎;
(4)對于會對地鐵事故產生交互作用的變量組合進行識別,具體有工作日且非高峰期、周末或高峰期、無信號故障且無碰撞、信號故障或碰撞、有車門故障且無車輛故障、無車門故障或有車輛故障;
步驟三:建立模型:將樣本分為兩部分,隨機選取80%的數據作為訓練樣本,用于初始樹形結構的構建,剩余20%的數據作為檢驗樣本,用于初始樹形結構的剪枝;
(一)建樹:
(1)對于具有nk個樣本觀測數量的節點k,計算預測模型的參數的最大對數似然值LL(k),其中yi表示節點k的第i個觀測值;
(2)對于具有m個解釋變量的集合X=(x1,x2,...,xm),給定讓其與變量xj,j=1,2,...,m進行組合,根據變量xi和xj組合的所有取值情況來搜尋所有可能的分裂方案;單變量分裂是雙變量分裂的一種特殊情形,即xi=xj;設xi和xj的取值個數分別為h和p;雙變量分裂產生的所有可能的分裂方案可以表示為:
節點k處由分裂方案產生的最大對數似然值增量為:
其中,只有時,方案可行;
對分裂方案集Sij的窮舉搜索,最終找到對數似然值增量最大的最優方案即:
(3)對于給定變量xi,通過步驟(2)找到其最佳配對變量和相應的節點k的最優方案
(4)在對所有變量組合進行搜索后,通過搜尋總體對數似然值最大增量得到總體最優分裂方案找到最佳變量組合
(5)若則節點k被視作葉節點;否則,分裂方案被用來對節點k進行劃分;
(6)當滿足以下兩個分裂停止規則的其中一個時,停止建樹:
(a)底部任意一個節點有不能繼續劃分;
(b)當前樹形結構的深度達到了閾值;
否則,返回步驟(1);
(二)剪枝:采用復雜成本剪枝算法對樹形結構進行修剪,移除對預測準確度無貢獻的分支;使用赤池信息量準則來代表最大似然回歸樹T的成本,最小化AIC值,生成最優樹;其中,樹T的AIC值表示為:
(1)對于初始樹Tj,設k是其內部節點,且k具有葉節點,Tk表示以k為根節點的子樹,Tj-Tk表示從初始樹Tj剪掉子樹Tk,其中節點k保留;計算樹Tj和Tj-Tk的AIC值,得到AIC(Tj)和AIC(Tj-Tk);
(2)對樹Tj自下向上尋找所有可能的節點k,將其記作集合K,重復步驟一的操作,求出相應的AIC(Tj-Tk),k∈K,從中找出最小的AIC(Tj-Tk),并將此節點記為k*,則有:
(3)比較和AIC(Tj)的大小,若則將樹設置為新的初始樹,即令然后返回步驟一,對樹進行新一輪的搜索;否則,樹Tj即為最優樹,停止搜索;
步驟四:校驗模型:
將訓練樣本和檢驗樣本分別應用于傳統單變量分裂的最大似然回歸樹模型,計算對數似然值和AIC值,并與雙因素分裂的最大似然回歸樹模型進行比較;
步驟五:預測比對:
基于步驟一收集到的數據,建立雙因素分裂的最大似然回歸樹;
在最優樹形結構的每個葉節點處建立預測模型,對地鐵事故延誤作出預測。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海海事大學,未經上海海事大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810915093.9/1.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





