[發明專利]基于梯度提升決策樹的出行生成預測方法、系統及裝置有效
| 申請號: | 202010823717.1 | 申請日: | 2020-08-17 |
| 公開(公告)號: | CN111784084B | 公開(公告)日: | 2021-12-28 |
| 發明(設計)人: | 杜立群;劉斌;鄭猛;張宇;吳丹婷;呂宜生;李志帥 | 申請(專利權)人: | 北京市城市規劃設計研究院;中國科學院自動化研究所 |
| 主分類號: | G06Q10/04 | 分類號: | G06Q10/04;G06Q50/26;G06K9/62 |
| 代理公司: | 北京市恒有知識產權代理事務所(普通合伙) 11576 | 代理人: | 郭文浩;尹文會 |
| 地址: | 100045 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 梯度 提升 決策樹 出行 生成 預測 方法 系統 裝置 | ||
1.一種基于梯度提升決策樹的出行生成預測方法,其特征在于,該出行生成預測方法包括:
步驟S10,提取待預測區域的各個交通小區的當前出行生成數據的自變量,并進行自變量的歸一化處理,獲得預處理數據;所述待預測區域的各個交通小區的歷史出行生成數據包括自變量和因變量;所述自變量包括各個交通小區內有車和無車家庭數量和人口數量、有車和無車工作人員、學生、其他類型人員的數量、每類就業崗位的總人數;所述就業崗位包括工業、水利環境與公共設施、交通運輸與郵政倉儲、公共管理、教育、居民服務業、金融業、信息科技服務業、農林牧漁業;所述因變量包括各個交通小區內有車、無車家庭基于家庭和非基于家庭的出行產生量;
步驟S20,基于所述預處理數據,通過訓練好的出行生成預測模型,獲取待預測區域的各個交通小區當前的預測值;
步驟S30,對所述預測值進行反歸一化,獲得待預測區域的各個交通小區當前的預測出行生成數據;
其中,所述出行生成預測模型,為梯度提升決策樹模型結構,以決策樹作為基學習器,以模型中所有決策樹輸出之和作為模型的輸出,以平方誤差作為模型預測值與真實值之間的損失函數L,模型訓練方法為:
步驟B10,提取待預測區域的各個交通小區的歷史出行生成數據的自變量和因變量,并進行歸一化處理,根據預設的比例將歸一化后的數據劃分為訓練集和測試集;
步驟B20,基于訓練集的各訓練數據進行N輪出行生成預測模型訓練,在第n輪訓練中,在模型中新增第n棵決策樹,基于損失函數L計算第n輪模型輸出的誤差負梯度值r(n+1)i;1≤n≤N為當前模型訓練的輪次;
步驟B30,在模型中新增第n+1棵決策樹,將第n輪的誤差負梯度值r(n+1)i作為標簽,進行第n+1棵決策樹的訓練:
Θn+1為模型第n+1輪訓練時第n+1棵決策樹的參數,r(n+1)i為第n輪模型輸出的誤差負梯度值,Lb(r(n+1)i,T(xi,Θn+1))代表模型第n+1輪訓練的第n+1棵決策樹輸出的預測值T(xi,Θn+1)與對應的誤差負梯度值r(n+1)i真之間的損失值,m為訓練集中訓練數據的數量;
Lb為基學習器的損失函數,D為模型第n+1輪訓練時負梯度r(n+1)i和第n+1棵決策樹輸出的預測值T(xi,Θn+1)的維數;
第n+1棵決策樹訓練完成后,繼續進行第n+2棵決策樹訓練,直至N棵決策樹訓練完成;
步驟B40,將測試集的各測試數據中的自變量輸入訓練好的出行生成預測模型,獲取出行生成預測模型輸出的預測值,計算所述預測值與自變量對應的因變量之間的R2值、均方根誤差和平均絕對誤差,若所述R2值接近1且所述均方根誤差和平均絕對誤差小于設定閾值,則所述出行生成預測模型性能滿足要求;否則增加訓練輪次或調整基學習器決策樹的結構并使用原訓練集再次進行模型訓練,直至測試結果滿足設定閾值,獲得訓練好的出行生成預測模型;
其中,決策樹的訓練過程是遍歷每個特征的每個可能取值,分別計算平方誤差,找到使平方誤差最小的那個劃分特征j和對應的劃分節點s,獲得最佳劃分節點(j,s):
表示在第j維特征x(j)下被s劃分的兩個區域,c1,c2為兩個區域內所有樣本的均值,Nt為兩個區域內所有樣本數量:
對兩個子區域內的數據各自用上述步驟繼續劃分子區域,直至滿足決策樹葉子節點的個數等于設定值時停止;
葉子節點個數為4,則將輸入x劃分成4個子區域每個區域樣本均值為最終的CART學習器為:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京市城市規劃設計研究院;中國科學院自動化研究所,未經北京市城市規劃設計研究院;中國科學院自動化研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010823717.1/1.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





