[發(fā)明專利]一種基于主題模型的多因素融合民航旅客出行預測方法有效
| 申請?zhí)枺?/td> | 201611159984.3 | 申請日: | 2016-12-15 |
| 公開(公告)號: | CN106779214B | 公開(公告)日: | 2020-08-28 |
| 發(fā)明(設計)人: | 劉杰;王嫄;馮麗娜;陳會朋 | 申請(專利權)人: | 南開大學 |
| 主分類號: | G06F17/40 | 分類號: | G06F17/40 |
| 代理公司: | 天津佳盟知識產(chǎn)權代理有限公司 12002 | 代理人: | 侯力 |
| 地址: | 300071*** | 國省代碼: | 天津;12 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 主題 模型 因素 融合 民航 旅客 出行 預測 方法 | ||
1.一種基于主題模型的多因素融合民航旅客出行預測方法,采用數(shù)據(jù)挖掘理論和方法對民航數(shù)據(jù)中旅客出行行為進行分析,運行環(huán)境要求所使用的計算機平臺配備不低于8G的內存,CPU核心數(shù)不低于4個且主頻不低2.6GHz、Windows 7及以上版本的64位操作系統(tǒng),并安裝Oracle數(shù)據(jù)庫、Java 1.7及以上版本、Matlab 2011b及以上版本必備軟件環(huán)境;其特征在于,該方法包括:
步驟1):構建旅客關聯(lián)圖出行主題模型;包括構建旅客的關聯(lián)圖,并對旅客出行選擇概率分布進行主題建模,最終得到旅客關聯(lián)圖出行主題模型:
步驟1.1)、構建旅客關聯(lián)圖;
構建旅客關聯(lián)圖,就是計算旅客之間的關聯(lián)度,它由旅客航線共現(xiàn)度和屬性共現(xiàn)度共同決定;航線共現(xiàn)度由旅客之間的航線共現(xiàn)數(shù)決定;屬性共現(xiàn)度是指旅客的年齡、性別、平均折扣、平均里程是否相同;旅客年齡、平均折扣、平均里程信息由基于方差的切分方法得到;
步驟1.2)、對旅客出行選擇概率分布主題建模;
基于主題模型對旅客和其搭乘的航線、航空公司進行主題建模,發(fā)現(xiàn)并求得旅客、航線、航空公司的潛在主題分布,最終將旅客的潛在主題分布和航空公司、航線的潛在主題分布相結合,得到旅客對航空公司和航線的出行選擇概率分布信息;
步驟1.3)、構建旅客關聯(lián)圖出行主題模型;
在步驟1.2)主題建模過程中加入步驟1.1)中的旅客關聯(lián)圖,以構建旅客關聯(lián)圖出行主題模型(Passenger Graph based Travel Topic Model,PGTTM);PGTTM在為每個旅客的航線、航空公司分配主題時,使得主題不僅來自于旅客本身,還有可能來自于旅客關聯(lián)的其他旅客;這樣能夠豐富主題信息,提高預測性能,并減輕民航旅客出行稀疏性的問題;
步驟2):構建航線熱度、旅客忠誠度、航空公司市場占有率計算模型,利用這些先驗知識,能夠幫助后面準確預測:
步驟2.1)、計算航線的熱度;
對于航線熱度,首先統(tǒng)計該航線被全部旅客搭乘的次數(shù),以及每個航線被全部旅客搭乘的次數(shù)之和,在此基礎上,計算得到航線熱度;
步驟2.2)、計算旅客對航空公司的忠誠度;
對于旅客忠誠度,首先統(tǒng)計該旅客搭乘該航空公司的次數(shù),以及該旅客搭乘每一個航空公司的次數(shù)之和,在此基礎上,經(jīng)過平滑處理,計算得到旅客對航空公司的忠誠度;
步驟2.3)、計算航空公司對航線的市場占有率;
對于航空公司市場占有率,首先統(tǒng)計該航空公司、該航線作為一個詞對被全部旅客搭乘的次數(shù),以及在不考慮航空公司下該航線被全部旅客搭乘的次數(shù),基于此,計算得到航空公司對航線的市場占有率;
步驟3):通過貝葉斯概率模型,構建多因素融合預測框架;通過貝葉斯概率模型融合航線熱度、旅客對航線選擇概率分布、旅客忠誠度以及航空公司市場占有率,對旅客將來選擇的航線、航空公司進行預測:
步驟3.1)、基于貝葉斯概率模型的多因素融合;
基于步驟1.3)中PGTTM得到的旅客對航線選擇概率分布,步驟2.1)中的航線熱度,步驟2.2)中的旅客忠誠度,以及步驟2.3)中的航空公司市場占有率,構建貝葉斯概率模型,對這四部分因素進行融合,更好建模旅客的出行行為;
步驟3.2)、基于貝葉斯概率模型的多因素預測;
針對每個旅客、每個航空公司-航線詞對,利用貝葉斯概率模型函數(shù),分別計算旅客的搭乘概率;對每個旅客而言,挑選出概率最大的幾個航空公司-航線詞對,進行預測和推薦。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南開大學,未經(jīng)南開大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611159984.3/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。





