[發明專利]一種基于主題模型的多因素融合民航旅客出行預測方法有效
| 申請號: | 201611159984.3 | 申請日: | 2016-12-15 |
| 公開(公告)號: | CN106779214B | 公開(公告)日: | 2020-08-28 |
| 發明(設計)人: | 劉杰;王嫄;馮麗娜;陳會朋 | 申請(專利權)人: | 南開大學 |
| 主分類號: | G06F17/40 | 分類號: | G06F17/40 |
| 代理公司: | 天津佳盟知識產權代理有限公司 12002 | 代理人: | 侯力 |
| 地址: | 300071*** | 國省代碼: | 天津;12 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 主題 模型 因素 融合 民航 旅客 出行 預測 方法 | ||
一種基于主題模型的多因素融合民航旅客出行預測方法。本發明首先構建旅客之間的關聯圖,并針對旅客偏好進行主題建模,進而構建旅客關聯圖出行主題模型(Passenger Graph based Travel Topic Model,PGTTM),能夠豐富主題信息、有效解決民航數據稀疏性問題;其次通過貝葉斯概率模型構建多因素融合預測框架,融合航線熱度、PGTTM得到的旅客對航線偏好、旅客忠誠度和航空公司市場占有率信息,對旅客的未來出行進行精準預測。此發明能夠有效預測旅客未來出行的航空公司和航線,可為航空及相關產業提供有效的決策支持,為旅客提供個性化服務。
技術領域
本發明屬于計算機應用技術領域,涉及數據挖掘和民航數據分析,特別是一種基于主題模型的多因素融合民航旅客出行預測方法。
背景技術
人們生活水平的提高、互聯網的發展,使民航旅客訂票系統中積累了大量訂票數據,具有海量性、稀疏性、長尾性特點,給民航數據分析帶來挑戰。基于這些數據分析旅客出行特點、預測未來出行行為,是民航數據分析中最重要的任務之一。國內外關于民航旅客分析研究處于初步階段,也沒有對民航旅客出行預測有較多研究。
民航數據相關的分析研究例如Maalouf等對真實的航空公司頻繁旅客數據應用聚類分析和關聯規則等,對客戶關系管理提出推薦和改善策略[1]。而王朝恩等采用問卷調查并結合統計方法,對長春民航旅客群體進行消費動機、航空公司偏好以及購買行為分析[2]。Feng等人構建民航數據上的異質信息網絡,采用隨機游走方式進行低頻次出行旅客價值發現任務[3]。而Etzioni等探究了時間與票價之間關聯性,采用一種多策略數據挖掘算法,告知旅客購買機票的最佳時間[4]。
主題模型中的LDA(Latent Dirichlet Allocation)模型有更好文本主題建模性能,具有良好擴展性[5]。如Rosen-Zvi等基于LDA提出ATM(Author-Topic Model),同時對作者、文檔和詞進行主題建模[6]。而Blei等針對文本分類問題提出有監督LDA模型,將訓練語料中文檔標記作為觀測值加入LDA中[7]。拓展主題模型或LDA模型應用到推薦領域,如Liu等將旅行套餐數據中隱含特征顯示加入主題模型中,提出一種個性化推薦旅游信息方法[8]。而Tan等將旅客信息表示成特征-值對形式,采用主題模型學習旅客潛在興趣分布,并結合協同過濾進行旅行套餐推薦[9]。
旅客間社會關系有助于建模,如王琨琨等通過構建共同出行網絡,提出一種旅客個體偏好和關系偏好結合的民航旅客座位偏好建模方法[10]。而周元煒等提出一個基于信息圖的半監督關系分類算法,獲得更為準確的旅客關系,提供針對性、高質量服務[11]。
將主題模型應用到民航旅客出行分析和預測中,發現潛在主題分布、解決數據海量性問題,是值得嘗試的,以及將旅客之間的關系融入到主題建模中,豐富主題信息、減輕稀疏性問題,借此來提高建模的效果。另外通過構建概率模型框架,融合多種出行影響因素,對提高預測效果同樣拭目以待。
參考文獻:
[1]Maalouf L,Mansour N.Mining airline data for crm strategies.InProceeding of the 7th WSEAS International Conference on Simulation,Modelingand Optimization,Beijing,China,pages 345-350,2007.
[2]王朝恩,長春民航旅客特征與行為分析[D].吉林大學,2010.
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南開大學,未經南開大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611159984.3/2.html,轉載請聲明來源鉆瓜專利網。





