[發明專利]一種基于級聯訓練集成學習的航空旅客偏好預測方法在審
| 申請號: | 202110600427.5 | 申請日: | 2021-05-31 |
| 公開(公告)號: | CN113361757A | 公開(公告)日: | 2021-09-07 |
| 發明(設計)人: | 王百城;陳凱;龍勝春 | 申請(專利權)人: | 浙江工業大學 |
| 主分類號: | G06Q10/04 | 分類號: | G06Q10/04;G06K9/62 |
| 代理公司: | 杭州斯可睿專利事務所有限公司 33241 | 代理人: | 王利強 |
| 地址: | 310014 浙江省*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 級聯 訓練 集成 學習 航空 旅客 偏好 預測 方法 | ||
一種基于級聯訓練集成學習的航空旅客偏好預測方法,所述方法包括以下步驟:步驟1.使用開源航空旅客數據集或者自行建立數據集,并對數據集進行預處理;步驟2.訓練階段,采用級聯訓練方法;步驟3.集成學習階段,采用分類器融合方法,根據AUC指標篩選出級聯訓練所得分類器中待融合的分類器集合,采用分類器貪心融合方法形成集成模型;步驟4.使用融合得到的最終模型對測試集進行測試,得到航空旅客偏好預測結果。本發明有效提升了預測的效果,提高了預測結果的可信度。
技術領域
本發明屬于數據挖掘、客戶分類領域,涉及一種基于級聯訓練集成學習的航空旅客偏好預測方法。
背景技術
隨著我國航空運輸網絡不斷完善,市場競爭逐漸激烈,服務質量是影響航空企業生存的重要因素。為了提升服務質量,把握客戶資源,企業越來越關注旅客偏好。因此提取、預測旅客偏好,對于企業穩定旅客的增量和存量具有重要作用。航空旅客的偏好主要體現在艙位選擇、出行時間、飛行里程、是否付費選座等方面。其中付費選座是指,旅客提前挑選預訂機艙內自己心儀的座位,并為此服務支付費用。選座服務費用作為客票以外的附加費,是市場規律催生的產物之一。通過提供付費選座服務,不僅能夠滿足旅客的舒適出行需求,也能提升航空公司的服務水平和獲得機票以外的收益。因此,航空公司希望有更多的旅客選擇這項服務。而通過精準識別有付費意愿的旅客并實施精準營銷,能夠在耗費較低營銷成本的情況下,達到相對滿意的營銷效果。
但是目前針對航空付費選座領域的預測方法較少,傳統采用單模型預測方法,模型效果并不理想,可信度較低,不利于降低成本。因此推進航空領域進行更加科學、有效的數據挖掘分析工作,準確預測航空旅客選座偏好,幫助企業把握旅客資源,提升核心競爭力,對于航空企業發展具有重要意義。
發明內容
為了克服已有技術的不足,解決相關數據集普遍的樣本不平衡問題,同時進一步提升預測精度,本發明提供一種基于級聯訓練集成學習的航空旅客偏好預測方法,采用級聯訓練方法,既有效解決了樣本不平衡問題,又迫使模型更關注難分類樣本,而且避免了欠采樣方法導致的信息缺失問題;然后采用分類器貪心融合方法,融合級聯訓練階段得到的分類器,形成最終預測模型。
本發明解決其技術問題所采用的技術方案是:
一種基于級聯訓練集成學習的航空旅客偏好預測方法,所述方法包括以下步驟:
步驟1.使用開源航空旅客數據集或者自行建立數據集,并對數據集進行預處理,過程如下:
1.1)利用AdaBoost方法選擇特征,使用基于閾值的決策樹作為弱分類器,去除冗余、無關特征,挑選出主要特征,提高模型訓練效率;
1.2)將數據集分為訓練集,驗證集和測試集;
步驟2.訓練階段,采用級聯訓練方法,既有效解決了樣本不平衡問題,又迫使模型更關注難分類樣本,而且避免了欠采樣方法導致的信息缺失問題,過程如下:
2.1)將訓練集劃分為正負樣本,P為正樣本,即付費選座,N為負樣本,設置誤報率f值;
2.2)設置學習算法(如XGBoost算法)種類數為K,第i種學習算法的第j個分類器為Mij,令i=0,j=0,設置一個暫時為空的分類器集合M;
2.3)設置樣本集N’,令N’=N,i=i+1;
2.4)對N’下采樣得到新負樣本集Ns,Ns的樣本數量=P的樣本數量,正負樣本平衡,得到新訓練集F,由Ns和P組成;
2.5)令j=j+1,使用第i種學習算法在訓練集F訓練上得到分類器Mij,并用其預測N’;
2.6)根據預測結果調整類別概率閾值,滿足誤報率f;
2.7)刪除N’中分類器正確的樣本;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江工業大學,未經浙江工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110600427.5/2.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





