[發(fā)明專利]一種購票信息分析的方法及裝置在審
| 申請?zhí)枺?/td> | 201611198401.8 | 申請日: | 2016-12-22 |
| 公開(公告)號: | CN107527223A | 公開(公告)日: | 2017-12-29 |
| 發(fā)明(設(shè)計)人: | 趙忠信;曹文潔 | 申請(專利權(quán))人: | 北京銳安科技有限公司 |
| 主分類號: | G06Q30/02 | 分類號: | G06Q30/02;G06Q50/26;G06N7/00 |
| 代理公司: | 北京品源專利代理有限公司11332 | 代理人: | 胡彬,鄧猛烈 |
| 地址: | 100044 北京市海淀區(qū)西小口*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 購票 信息 分析 方法 裝置 | ||
1.一種購票信息分析的方法,其特征在于,所述方法包括:
從乘客的屬性信息、出行目的分布、購票次數(shù)、車次類型分布、購票方式分布、始發(fā)站分布、終點站分布、結(jié)伴關(guān)系提取乘客的購票行為模式特征;
通過乘客隱藏狀態(tài)向量表征乘客的購票行為模式,則每個乘客為一個乘客在高維空間中的一個點,若所述乘客的類型是未知的,則將對所述乘客的類別判定問題轉(zhuǎn)化為對所述乘客隱藏狀態(tài)向量的概率密度分布進行擬合學(xué)習(xí)的過程。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述乘客的屬性信息包括對數(shù)據(jù)文件按照年齡進行統(tǒng)計得到乘客年齡分布信息;
所述出行目的分布包括根據(jù)從身份證信息中解析出的省份籍貫編號信息再結(jié)合始發(fā)站和終點站的行政區(qū)劃代碼判斷籍貫編號與始發(fā)站、終點站的行政區(qū)劃代碼是否相等,將乘客根據(jù)出行目的劃分為預(yù)設(shè)個數(shù)的類別,各類別之間不重復(fù)不遺漏的分布;其中,odh代表始發(fā)站終點站都與籍貫一致,在家鄉(xiāng)省內(nèi)短途出行;odo代表始發(fā)站和終點站一致,但是在家鄉(xiāng)以外的省短途出行;o代表離開家鄉(xiāng)去外省出行;d代表從外省回家;other代表其他情況;
所述購票次數(shù)包括改簽次數(shù)、退票次數(shù)和有效購票次數(shù),所述改簽次數(shù)為購票記錄中狀態(tài)為3的記錄的頻數(shù);所述退票次數(shù)為購票記錄中狀態(tài)為2的記錄的頻數(shù);所述有效購票次數(shù)為購票記錄中狀態(tài)為5的記錄的頻數(shù);
所述車次類型分布包括根據(jù)乘客有多條乘車記錄得到不同車次類型的序列,分別計算各車次類型經(jīng)濟性、快捷性、舒適性的得分,再相加求和并除以乘車記錄次數(shù),各指標值得分為預(yù)設(shè)時間內(nèi)所有乘車記錄的相應(yīng)指標的平均值的分布;
所述購票方式分布包括根據(jù)乘客有多條乘車記錄得到不同購票方式的序列,分別計算各車次類型經(jīng)濟性、快捷性的得分,再相加求和并除以乘車記錄次數(shù),各指標值得分為預(yù)設(shè)時間內(nèi)所有乘車記錄的相應(yīng)指標的平均值的分布;
所述始發(fā)站分布包括根據(jù)始發(fā)站的數(shù)目、最大似然概率、車站重要性系數(shù)和始發(fā)站分布的熵,所述始發(fā)站的數(shù)目為以乘客身份證號為鍵,聚合乘客所有的購票記錄,在所有的購票記錄中,出現(xiàn)不同的始發(fā)站的數(shù)量;所述最大似然概率為在每個乘客的購票記錄中,出現(xiàn)次數(shù)最多的車站,概率用頻數(shù)除以總共的購票次數(shù)來計算;所述車站重要性系數(shù)為每個車站的重要性系數(shù)用當(dāng)天該車站的總發(fā)送人數(shù)除以所有車站的總發(fā)送人數(shù)來計算;所述始發(fā)站分布的熵為聚合單個乘客所有的購票記錄,得到所有購票記錄中始發(fā)站的集合,統(tǒng)計集合中不同的項的頻數(shù),并計算離散分布的熵;
所述終點站分布包括終點站的數(shù)目、最大似然概率、車站重要性系數(shù)和終點站分布的熵;所述終點站的數(shù)目為以乘客身份證號為鍵,聚合乘客所有的購票記錄,在所有的購票記錄中,出現(xiàn)不同的終點站的數(shù)量;所述最大似然概率為在每個乘客的購票記錄中,出現(xiàn)次數(shù)最多的車站,概率用頻數(shù)除以總共的購票次數(shù)來計算;所述車站重要性系數(shù)為每個車站的重要性系數(shù)用當(dāng)天該車站的總預(yù)計到站人數(shù)除以所有車站的總預(yù)計到站人數(shù)來計算;所述終點站分布的熵為聚合單個乘客所有的購票記錄,得到所有購票記錄中終點站的集合,統(tǒng)計集合中不同的項的頻數(shù),并計算離散分布的熵。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述結(jié)伴關(guān)系包括在獲取的一段時間間隔內(nèi)的乘客購票流數(shù)據(jù)中,如果乘客A與乘客B同一天同一個始發(fā)站上車,去往同一個目的站,乘坐同一輛列車,在同一個車廂內(nèi),使用相同的購票方式在同一個車站的同一個窗口購票,且滿足支持度和置信度的要求,則乘客A與乘客B具有的結(jié)伴關(guān)系。
4.根據(jù)權(quán)利要求1至3任意一項所述的方法,其特征在于,所述從乘客的屬性信息、出行目的分布、購票次數(shù)、車次類型分布、購票方式分布、始發(fā)站分布、終點站分布、結(jié)伴關(guān)系提取乘客的購票行為模式特征,包括:
用一個向量表征一個乘客的隱藏狀態(tài),將離散的、定性的數(shù)據(jù)標識轉(zhuǎn)化為連續(xù)的、定量的數(shù)據(jù)形式;
根據(jù)對預(yù)設(shè)時間間隔內(nèi)的購票數(shù)據(jù)進行統(tǒng)計分析,用最大似然概率描述乘客最可能的購票方式,將定性的、標簽性的數(shù)據(jù)轉(zhuǎn)化為連續(xù)的、定量的數(shù)據(jù)形式;
通過聚合在所述預(yù)設(shè)時間間隔內(nèi)的乘客所有乘車記錄中的購票方式,計算購票方式分布的熵和不同購票方式的個數(shù)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京銳安科技有限公司,未經(jīng)北京銳安科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611198401.8/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
- 信息記錄介質(zhì)、信息記錄方法、信息記錄設(shè)備、信息再現(xiàn)方法和信息再現(xiàn)設(shè)備
- 信息記錄裝置、信息記錄方法、信息記錄介質(zhì)、信息復(fù)制裝置和信息復(fù)制方法
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄設(shè)備、信息重放設(shè)備、信息記錄方法、信息重放方法、以及信息記錄介質(zhì)
- 信息存儲介質(zhì)、信息記錄方法、信息重放方法、信息記錄設(shè)備、以及信息重放設(shè)備
- 信息存儲介質(zhì)、信息記錄方法、信息回放方法、信息記錄設(shè)備和信息回放設(shè)備
- 信息記錄介質(zhì)、信息記錄方法、信息記錄裝置、信息再現(xiàn)方法和信息再現(xiàn)裝置
- 信息終端,信息終端的信息呈現(xiàn)方法和信息呈現(xiàn)程序
- 信息創(chuàng)建、信息發(fā)送方法及信息創(chuàng)建、信息發(fā)送裝置





