[發明專利]一種結合CNN和LSTM的航班平均票價預測方法在審
| 申請號: | 202011102260.1 | 申請日: | 2020-10-15 |
| 公開(公告)號: | CN112232483A | 公開(公告)日: | 2021-01-15 |
| 發明(設計)人: | 游進國;甘國育;趙志超;鄒本源;賈連印;丁家滿;李曉武 | 申請(專利權)人: | 昆明理工大學 |
| 主分類號: | G06N3/04 | 分類號: | G06N3/04;G06N3/08;G06F17/18;G06Q30/02;G06Q50/30 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 650093 云*** | 國省代碼: | 云南;53 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 結合 cnn lstm 航班 平均 票價 預測 方法 | ||
1.一種結合CNN和LSTM的航班平均票價預測方法,其特征在于,包括如下步驟:
1)對影響航班票價的多種特征進行融合處理形成票價序列數據;
2)將票價序列數據劃分為訓練集(包括驗證集)和測試集;
3)將訓練集(包括驗證集)數據輸入到AFFF_CNN_LSTM模型進行訓練;
4)使用AFFF_CNN_LSTM模型進行測試與評估。
2.根據權利要求1所述的一種結合CNN和LSTM的航班平均票價預測方法,其特征在于,所述步驟1)具體包括如下步驟:
1.1:航班數據、旅客數據、票價數據分別存儲在不同的數據表中,需要對各數據表進行重復值的刪除和對空值進行處理等以得到無冗余數據;
1.2:將這些無冗余數據進行連接處理以及分組聚合后,以航班數據表為主表進行左連接拼接形成航班平均票價數據,按時間排序后形成票價序列數據。
3.根據權利要求1所述的一種結合CNN和LSTM的航班平均票價預測方法,其特征在于:
所述步驟2)包括如下步驟:
2.1:根據航班平均票價序列數據可以確定樣本量samples以及樣本維度features,確定好時間步長steps后便可將航班平均票價序列數據構造成模型需要的三維張量作為模型的輸入,構建訓練集(包括驗證集)Train=(Xtrain,Ytrain)和測試集Test=(Xtest,Ytest)。
4.根據權利要求1所述的一種結合CNN和LSTM的航班平均票價預測方法,其特征在于:
所述步驟3)包括如下步驟:
3.1:首先需要搭建AFFF_CNN_LSTM模型,該模型使用Keras庫的函數式API進行搭建;
3.2:AFFF_CNN_LSTM模型主要包括兩部分:一是編碼器-解碼器網絡,采用一個LSTM作為編碼器,另一個LSTM作為解碼器,該編碼器-解碼器網絡結構獲取航班平均票價的長期依賴性;二是三層卷積神經網絡,使用三層CNN獲取航班平均票價序列關鍵的空間局部特征,AFFF_CNN_LSTM模型將一二部分的輸出連接起來后通過全連接層進行最后的輸出;
3.3:將訓練集數據Train=(Xtrain,Ytrain)輸入LSTM構造的編碼器-解碼器網絡結構中,同時也輸入三層CNN網絡中,AFFF_CNN_LSTM模型將這兩個網絡的輸入合并后通過全連接層進行輸出,基于驗證集,模型采用反向傳播算法進行訓練調參;
3.4:采用K折驗證對模型進行校正評估,采用添加權重正則化和dropout方法防止模型過擬合,采用網格搜索方法對超參數調優選取,采用MSE作為模型的損失函數,采用Adam作為模型優化器;基于驗證集,實驗表明,當歷史時間窗口步長steps=256,LSTM構成的編碼器和解碼器對應的隱層單元維度分別為m=36,n=32,第一層卷積神經網絡單元維度p=64,第二和第三層卷積神經網絡隱層單元維度為k=h=32時,預測未來t=12個時刻的航班平均票價在驗證集上的效果相對較優。
5.根據權利要求1所述的一種結合CNN和LSTM的航班平均票價預測方法,其特征在于:
所述步驟4)包括如下步驟:
4.1:將訓練好的AFFF_CNN_LSTM模型、ARIMA模型、LSTM模型和Seq2Seq模型在測試集上進行測試,并預測未來t個時刻的航班平均票價,然后計算測試結果的RMSE、MSE、MAE和MAPE值,將各模型的這四個評價指標進行對比分析。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于昆明理工大學,未經昆明理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011102260.1/1.html,轉載請聲明來源鉆瓜專利網。





