[發(fā)明專利]一種基于PCA和Adaboost的隧道交通事故持續(xù)時間預測方法在審
| 申請?zhí)枺?/td> | 202110480788.0 | 申請日: | 2021-04-30 |
| 公開(公告)號: | CN113326971A | 公開(公告)日: | 2021-08-31 |
| 發(fā)明(設計)人: | 楊順新;米夢陽;趙凱 | 申請(專利權)人: | 東南大學 |
| 主分類號: | G06Q10/04 | 分類號: | G06Q10/04;G06K9/62;G08G1/01 |
| 代理公司: | 南京經(jīng)緯專利商標代理有限公司 32200 | 代理人: | 劉莎 |
| 地址: | 210096 *** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 pca adaboost 隧道 交通事故 持續(xù)時間 預測 方法 | ||
本發(fā)明公開了一種基于PCA和Adaboost的隧道交通事故持續(xù)時間預測方法,包括以下步驟:導入歷史交通事故數(shù)據(jù):首先對數(shù)據(jù)進行預處理,根據(jù)事故的持續(xù)時間劃分為短、中、長和特長四個等級;并對預測模型中的輸入變量進行缺失值檢驗和處理;最后對分類變量進行熱編碼處理。使用PCA方法對原輸入變量進行去中心化處理并計算其協(xié)方差矩陣,在此基礎上計算其特征值和特征向量,從小到大依次確定若干個特征值及相應的特征向量。首先基于弱分類器對交通事故持續(xù)時間進行分類,經(jīng)過對樣本的訓練得到基礎分類結果;然后采用Adaboost迭代框架計算弱分類器的分類錯誤樣本,提高分類錯誤樣本的權值,在此基礎上構建下一個弱分類器,多次迭代后得到最終的強分類器。
技術領域
本發(fā)明涉及交通事故預測領域,具體是指一種基于PCA(Principle ComponentAnalysis,主成分分析法)和Adaboost(Adaboost分類)的高速公路隧道持續(xù)時間預測方法。
背景技術
高速公路作為國家經(jīng)濟的動脈,在城市中遠距離交通運輸中起著無可比擬的作用。而高速公路隧道作為公路交通中的一種特殊的構造物是交通事故的多發(fā)點,也是嚴重事故的易發(fā)點。相較于普通路段,隧道路段的事故會造成更大程度的交通擁堵,從而導致交通出行者需要花費更多的出行時間和成本,同時也會對人身、財產安全造成一定的威脅,容易引發(fā)一系列社會問題。因此,及時準確的預測交通事故持續(xù)時間是實現(xiàn)有效交通管控的前提條件,而且可以為事故下誘導性和預測性交通信息的及時發(fā)布、以及事故影響的快速消除提供依據(jù)。
目前針對高速公路隧道交通事故持續(xù)時間的預測方法主要包括兩類。第一類是參數(shù)模型,這種模型一般假設事故持續(xù)時間滿足某種分布,然后進行擬合優(yōu)度的檢驗,其中常用的有對數(shù)正態(tài)分布、威布爾分布等。常用的方法包括概率分布、回歸分析、決策樹、生存分析等方法。這類方法的有點在于模型較為簡單,并且對于最后的預測結果解釋性較強;而確定是對數(shù)據(jù)質量要求較高,且預測精度往往不高。第二類方法是非參數(shù)方法,如神經(jīng)網(wǎng)絡、遺傳算法、隨機森林、支持向量機、貝葉斯網(wǎng)絡等方法。尤其是近年來,隨著“人工智能”、“數(shù)據(jù)挖掘”等思想的發(fā)展,以上方法得到了很大發(fā)展。且眾多學者的研究結果表明相較于參數(shù)方法,非參數(shù)方法的預測精度更高,而其缺點是非參數(shù)方法的可移植性較差,且該類方法往往是依賴于“黑箱操作”,因此對于預測結果的解釋性不如參數(shù)方法。本文提出一種基于PCA和Adaboost算法的隧道交通事故持續(xù)時間預測方法,能直接采用弱分類器對隧道交通事故進行分類,并采用Adaboost的迭代框架將弱分類器集成為強分類器,從而進一步提高了分類準確率。
發(fā)明內容
本發(fā)明的主要目的在于解決現(xiàn)有技術中存在的隧道交通事故持續(xù)時間樣本量較大且預測精度不夠高的問題,提供一種基于PCA和Adaboost的隧道交通事故持續(xù)時間預測方法。
本發(fā)明為解決上述技術問題采用以下技術方案:
一種基于PCA和Adaboost的隧道交通事故持續(xù)時間預測方法,包括如下步驟:
第一步:從高速公路事件管理中心數(shù)據(jù)庫提取歷史隧道交通事故數(shù)據(jù),根據(jù)事故持續(xù)時間劃分為短、中、長和特長四個等級,并對數(shù)據(jù)進行缺失值檢驗和篩選;
第二步:使用PAC主成分分析法對第一步得到的數(shù)據(jù)進行的分析處理;
第三步:將第二步所得的主成分矩陣和相對應的事故持續(xù)時間的等級,代入Adaboost模型及逆行訓練,最終得到隧道交通事故持續(xù)時間的預測模型。
進一步,第一步的執(zhí)行步驟如下:
(1)根據(jù)事故持續(xù)時間的長短劃分為短、中、長和特長四個等級;
(2)對輸入變量中的類型進行檢驗,對于缺失值比例大于30%的變量不予考慮;對于缺失值比例不超過30%的變量使用特定方法填充缺失值;
(3)對分類變量進行熱編碼處理。
進一步,第二步的執(zhí)行步驟如下:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于東南大學,未經(jīng)東南大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110480788.0/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預測目的的數(shù)據(jù)處理系統(tǒng)或方法;其他類目不包含的專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預測目的的處理系統(tǒng)或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優(yōu)化,例如線性規(guī)劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規(guī)劃、調度或分配時間、人員或機器資源;企業(yè)規(guī)劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





