[發(fā)明專利]一種基于聚類和改進的xgboost的航班流量預測方法及系統(tǒng)有效
| 申請?zhí)枺?/td> | 202110503952.5 | 申請日: | 2021-05-10 |
| 公開(公告)號: | CN112926809B | 公開(公告)日: | 2021-07-23 |
| 發(fā)明(設計)人: | 高熙 | 申請(專利權)人: | 北京人人云圖信息技術有限公司 |
| 主分類號: | G06Q10/04 | 分類號: | G06Q10/04;G06Q10/06;G06Q30/02;G06Q50/30;G06K9/62 |
| 代理公司: | 北京中創(chuàng)云知識產權代理事務所(普通合伙) 11837 | 代理人: | 徐輝 |
| 地址: | 100191 北京市海淀區(qū)*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 改進 xgboost 航班 流量 預測 方法 系統(tǒng) | ||
1.一種基于聚類和改進的xgboost的航班流量的預測方法,其特征在于,包括:
獲取近一年各個航班的屬性信息;
對各個航班的屬性進行聚類,得到不同的聚類特征;
由各個航班近一年內的銷售數(shù)據(jù),生成歷史時序特征;
以不同的聚類特征和聚類特征組合作為空間特征與歷史時序特征為輸入構建并訓練若干xgboost子模型,選擇最優(yōu)化的xgboost子模型作為最終的xgboost模型;由各個航班的當前銷售記錄,生成各個航班當前時序特征;
最終的xgboost模型基于當前時序特征,預測各個航班在不同折扣下的流量;
各個航班的屬性信息,具體包括:
航班所屬航司的規(guī)模,航班起落城市屬性,航班所屬航線的運力,航班時間屬性;
對各個航班的屬性進行聚類,具體包括:
由航班所屬航司的規(guī)模聚類:按照近一年航司旅客數(shù)量,近一年的航司的所有航班的客座率均值,近一年航司的所有航班個數(shù),近一年航司的飛機數(shù)量四個特征進行聚類,得到低、中、高三個規(guī)模的航司分類;聚類過程包括:四個特征分別進行歸一化,分別選擇一個特征進行增強,其他特征不變,再由DBSCAN進行分類,獲得四個特征分別增強的分類結果,選擇分類效果最好的分類結果;
由航班起落城市屬性聚類:按照出發(fā)城市的經緯度、出發(fā)城市的城市規(guī)模、出發(fā)城市的去年的GDP、出發(fā)城市近一年的航班數(shù)、出發(fā)城市的機場個數(shù),五個特征進行兩兩相關性的計算,如果兩個特征的相關系數(shù)大于設定閾值則刪除兩個特征之一,以剩余特征采用K-MEANS、DBSCAN、和BRICH分別聚類出發(fā)城市屬性,采用投票的方式確定樣本歸屬類別;按照目的地城市的經緯度、目的地城市的城市規(guī)模、目的地城市的去年的GDP、目的地城市近一年的航班數(shù)、目的地城市的機場個數(shù),五個特征進行兩兩相關性的計算,如果兩個特征的相關系數(shù)大于設定閾值則刪除兩個特征之一,以剩余特征采用K-MEANS、DBSCAN、和BRICH分別聚類目的地城市屬性,采用投票的方式確定樣本歸屬類別;
由航班所屬航線的運力聚類:按照近一年常態(tài)下直達同航線運力及航班數(shù),轉機同航線運力及航班數(shù),四個特征進行兩兩相關性的計算,如果兩個特征的相關系數(shù)大于設定閾值則刪除兩個特征之一,以剩余特征采用BRICH方法聚類;
由航班時間屬性分類:按照航班起飛時段,按照早早、早、中、晚和晚晚進行分類,其中早早是指7:30及以前,早是指7:31-8:30,中是指:8:31-19:59晚是指:20:00-21:59,晚晚是指:22:00及以后;按照航班起飛日期,根據(jù)起飛日期是否是法定節(jié)假日、法定節(jié)假日前3天,法定節(jié)假日后3天,周末和工作日進行分類。
2.根據(jù)權利要求1所述的基于聚類和改進的xgboost的航班流量的預測方法,其特征在于,由各個航班歷史銷售數(shù)據(jù),生成歷史時序特征,具體包括:
根據(jù)各個航班的銷售記錄,生成從起飛前第N天到起飛當天的不同折扣下的銷售量,即時序特征。
3.根據(jù)權利要求1所述的基于聚類和改進的xgboost的航班流量的預測方法,其特征在于,以不同的聚類特征和聚類特征組合作為空間特征,與歷史時序特征為輸入構建并訓練若干xgboost子模型,包括:
用聚類的方法對各個航班的屬性進行聚類獲得的所有n個聚類特征中的單個聚類特征及所有可能的組合,分別構建對應的xgboost子模型,并分別訓練;xgboost子模型的數(shù)量為:其中i表示組合中特征的個數(shù);
選擇均方根誤差最小的xgboost子模型作為最終的xgboost模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京人人云圖信息技術有限公司,未經北京人人云圖信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110503952.5/1.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預測目的的數(shù)據(jù)處理系統(tǒng)或方法;其他類目不包含的專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預測目的的處理系統(tǒng)或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優(yōu)化,例如線性規(guī)劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規(guī)劃、調度或分配時間、人員或機器資源;企業(yè)規(guī)劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理
- 一種基于Xgboost框架的醫(yī)院門診就診量預測方法
- 一種基于xgBoost模型和Hadoop架構的竊電識別分析方法及終端
- 基于改進XGBoost的泛癌癥基因通路預測方法、系統(tǒng)和存儲介質
- 一種基于XGBoost算法的區(qū)塊鏈產品檢測方法、系統(tǒng)及裝置
- 用于XGBoost模型的解釋方法
- 基于XGboost模型的鋰離子電池荷電狀態(tài)估算
- 一種數(shù)據(jù)隱私保護協(xié)議的分析方法、裝置及電子設備
- 一種基于xgboost算法的短期電價預測方法及裝置
- 基于GA-PSO優(yōu)化XGBoost的水文時間序列預測方法
- 一種用戶異常用電行為檢測方法及裝置





