[發(fā)明專利]一種購(gòu)票信息分析的方法及裝置在審
| 申請(qǐng)?zhí)枺?/td> | 201611198401.8 | 申請(qǐng)日: | 2016-12-22 |
| 公開(kāi)(公告)號(hào): | CN107527223A | 公開(kāi)(公告)日: | 2017-12-29 |
| 發(fā)明(設(shè)計(jì))人: | 趙忠信;曹文潔 | 申請(qǐng)(專利權(quán))人: | 北京銳安科技有限公司 |
| 主分類號(hào): | G06Q30/02 | 分類號(hào): | G06Q30/02;G06Q50/26;G06N7/00 |
| 代理公司: | 北京品源專利代理有限公司11332 | 代理人: | 胡彬,鄧猛烈 |
| 地址: | 100044 北京市海淀區(qū)西小口*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 購(gòu)票 信息 分析 方法 裝置 | ||
技術(shù)領(lǐng)域
本發(fā)明實(shí)施例涉及的安全檢測(cè)的技術(shù)領(lǐng)域,尤其涉及一種購(gòu)票信息分析 的方法及裝置。
背景技術(shù)
鐵路是國(guó)家的重要基礎(chǔ)設(shè)施,是交通運(yùn)輸系統(tǒng)的骨干,是國(guó)民經(jīng)濟(jì)的大 動(dòng)脈,對(duì)國(guó)家的政治、經(jīng)濟(jì)、文化、國(guó)防建設(shè)都起到至關(guān)重要的作用。據(jù)2015 年數(shù)據(jù)統(tǒng)計(jì),全國(guó)鐵路營(yíng)業(yè)里程達(dá)到11.2萬(wàn)公里,路網(wǎng)密度116.48公里/萬(wàn) 平方公里,投資規(guī)劃超過(guò)3.3萬(wàn)億人民幣,全國(guó)鐵路旅客發(fā)送量超過(guò)23.57 億人次。
安全是鐵路運(yùn)輸?shù)纳€,直接關(guān)系著企業(yè)的生產(chǎn)效率、社會(huì)經(jīng)濟(jì)效益 和人身安全。目前,我國(guó)的鐵路安全監(jiān)測(cè)手段主要是利用傳感器、數(shù)據(jù)采集 傳輸儀器、數(shù)據(jù)分析軟件對(duì)軌道、列車等硬件設(shè)施的參數(shù)進(jìn)行實(shí)時(shí)的監(jiān)控分 析預(yù)警,然而,人作為旅客運(yùn)輸?shù)闹黝},人的一些購(gòu)票行為、運(yùn)輸過(guò)程中的 異常表現(xiàn)也有可能對(duì)鐵路運(yùn)輸、安全生產(chǎn)、正常秩序的維護(hù)產(chǎn)生不利的影響, 如何檢測(cè)這個(gè)特殊的乘客群體或縮小潛在危險(xiǎn)人群的搜索范圍,我國(guó)尚沒(méi)有 完善的理論模型與技術(shù)產(chǎn)品。
但從海量的乘客購(gòu)票數(shù)據(jù)中,應(yīng)用相關(guān)機(jī)器學(xué)習(xí)算法,提取有價(jià)值的模 式,面臨許多問(wèn)題:
(1)缺少標(biāo)記數(shù)據(jù),無(wú)法應(yīng)用監(jiān)督學(xué)習(xí)模型:
乘客的購(gòu)票數(shù)據(jù)中并沒(méi)有明確的標(biāo)記數(shù)據(jù)供模型學(xué)習(xí),人為地標(biāo)定數(shù)據(jù) 不僅耗時(shí)長(zhǎng)、成本高,而且具有顯著的主觀性,首先,并不能保證每個(gè)標(biāo)定 人員都具有領(lǐng)域?qū)I(yè)知識(shí),能準(zhǔn)確判斷購(gòu)票數(shù)據(jù)中的異常模式,其次,標(biāo)定 人員的判定標(biāo)準(zhǔn)可能并不一致,導(dǎo)致對(duì)同一數(shù)據(jù)的標(biāo)定可能會(huì)產(chǎn)生沖突,再 次,能獲得到的乘客購(gòu)票數(shù)據(jù)是不完全信息,從不完全信息中很難確定一條 明確的標(biāo)準(zhǔn)來(lái)判斷數(shù)據(jù)是否異常。
(2)數(shù)據(jù)不完備,缺乏多方面信息交叉驗(yàn)證:
數(shù)據(jù)不完備主要表現(xiàn)為兩個(gè)方面,第一,獲取到的乘客購(gòu)票數(shù)據(jù)中沒(méi)有 確切的乘客購(gòu)票時(shí)間數(shù)據(jù),乘客的購(gòu)票方式元數(shù)據(jù)并不完備;第二,僅僅從 乘客購(gòu)票數(shù)據(jù)中獲取的信息局限性太強(qiáng),識(shí)別出的離群點(diǎn)(在對(duì)數(shù)據(jù)的概率 密度函數(shù)進(jìn)行擬合之后,遍歷乘客購(gòu)票數(shù)據(jù)集,應(yīng)用最大似然估計(jì)法對(duì)乘客 向量進(jìn)行標(biāo)注,判斷乘客向量對(duì)每個(gè)類別簇的歸屬度,當(dāng)乘客對(duì)所有類別的 歸屬度都小于某個(gè)閾值時(shí),將其標(biāo)注為離群點(diǎn))也不能直接作為判斷乘客屬 于危險(xiǎn)人群的依據(jù)。要精確描述乘客的購(gòu)票行為模式,還需要其他方面信息 的支持、驗(yàn)證。
(3)乘客人群龐大,但個(gè)人乘車記錄比較稀疏,數(shù)據(jù)可壓縮空間小:
數(shù)據(jù)量龐大,每天乘車的人數(shù)有600萬(wàn)人次,高峰期甚至達(dá)到千萬(wàn)人次, 涉及到的人群也有數(shù)百萬(wàn)之眾。但歸結(jié)到個(gè)人,很大一部分乘客的年乘坐火 車的次數(shù)可能在10次以下,個(gè)人的乘車數(shù)據(jù)表現(xiàn)出顯著的稀疏性。本文應(yīng) 用的主要目標(biāo)是識(shí)別離群點(diǎn),檢測(cè)出乘客購(gòu)票行為的異常模式,所以,又不 能丟失個(gè)人的一些細(xì)節(jié)性的數(shù)據(jù),數(shù)據(jù)可壓縮空間小,在利用關(guān)聯(lián)分析算法 分析乘客的結(jié)伴出行時(shí),造成了算法的時(shí)間計(jì)算復(fù)雜度和空間計(jì)算復(fù)雜度都 很高。
發(fā)明內(nèi)容
本發(fā)明實(shí)施例的目的在于提出一種購(gòu)票信息分析的方法及裝置,旨在解 決如何從海量的乘客購(gòu)票數(shù)據(jù)中,應(yīng)用相關(guān)機(jī)器學(xué)習(xí)算法,提取有價(jià)值的模 式的問(wèn)題。
為達(dá)此目的,本發(fā)明實(shí)施例采用以下技術(shù)方案:
第一方面,一種購(gòu)票信息分析的方法,所述方法包括:
從乘客的屬性信息、出行目的分布、購(gòu)票次數(shù)、車次類型分布、購(gòu)票方 式分布、始發(fā)站分布、終點(diǎn)站分布、結(jié)伴關(guān)系提取乘客的購(gòu)票行為模式特征;
通過(guò)乘客隱藏狀態(tài)向量表征乘客的購(gòu)票行為模式,則每個(gè)乘客為一個(gè)乘 客在高維空間中的一個(gè)點(diǎn),若所述乘客的類型是未知的,則將對(duì)所述乘客的 類別判定問(wèn)題轉(zhuǎn)化為對(duì)所述乘客隱藏狀態(tài)向量的概率密度分布進(jìn)行擬合學(xué) 習(xí)的過(guò)程。
優(yōu)選地,所述乘客的屬性信息包括對(duì)數(shù)據(jù)文件按照年齡進(jìn)行統(tǒng)計(jì)得到乘 客年齡分布信息;
所述出行目的分布包括根據(jù)從身份證信息中解析出的省份籍貫編號(hào)信 息再結(jié)合始發(fā)站和終點(diǎn)站的行政區(qū)劃代碼判斷籍貫編號(hào)與始發(fā)站、終點(diǎn)站的 行政區(qū)劃代碼是否相等,將乘客根據(jù)出行目的劃分為預(yù)設(shè)個(gè)數(shù)的類別,各類 別之間不重復(fù)不遺漏的分布;其中,odh代表始發(fā)站終點(diǎn)站都與籍貫一致, 在家鄉(xiāng)省內(nèi)短途出行;odo代表始發(fā)站和終點(diǎn)站一致,但是在家鄉(xiāng)以外的省 短途出行;o代表離開(kāi)家鄉(xiāng)去外省出行;d代表從外省回家;other代表其他 情況;
所述購(gòu)票次數(shù)包括改簽次數(shù)、退票次數(shù)和有效購(gòu)票次數(shù),所述改簽次數(shù) 為購(gòu)票記錄中狀態(tài)為3的記錄的頻數(shù);所述退票次數(shù)為購(gòu)票記錄中狀態(tài)為2 的記錄的頻數(shù);所述有效購(gòu)票次數(shù)為購(gòu)票記錄中狀態(tài)為5的記錄的頻數(shù);
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京銳安科技有限公司,未經(jīng)北京銳安科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611198401.8/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06Q 專門(mén)適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測(cè)目的的數(shù)據(jù)處理系統(tǒng)或方法;其他類目不包含的專門(mén)適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測(cè)目的的處理系統(tǒng)或方法
G06Q30-00 商業(yè),例如購(gòu)物或電子商務(wù)
G06Q30-02 .行銷,例如,市場(chǎng)研究與分析、調(diào)查、促銷、廣告、買(mǎi)方剖析研究、客戶管理或獎(jiǎng)勵(lì);價(jià)格評(píng)估或確定
G06Q30-04 .簽單或開(kāi)發(fā)票
G06Q30-06 .購(gòu)買(mǎi)、出售或租賃交易
G06Q30-08 ..拍賣
- 信息記錄介質(zhì)、信息記錄方法、信息記錄設(shè)備、信息再現(xiàn)方法和信息再現(xiàn)設(shè)備
- 信息記錄裝置、信息記錄方法、信息記錄介質(zhì)、信息復(fù)制裝置和信息復(fù)制方法
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄設(shè)備、信息重放設(shè)備、信息記錄方法、信息重放方法、以及信息記錄介質(zhì)
- 信息存儲(chǔ)介質(zhì)、信息記錄方法、信息重放方法、信息記錄設(shè)備、以及信息重放設(shè)備
- 信息存儲(chǔ)介質(zhì)、信息記錄方法、信息回放方法、信息記錄設(shè)備和信息回放設(shè)備
- 信息記錄介質(zhì)、信息記錄方法、信息記錄裝置、信息再現(xiàn)方法和信息再現(xiàn)裝置
- 信息終端,信息終端的信息呈現(xiàn)方法和信息呈現(xiàn)程序
- 信息創(chuàng)建、信息發(fā)送方法及信息創(chuàng)建、信息發(fā)送裝置
- 一種數(shù)據(jù)庫(kù)讀寫(xiě)分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





