[發(fā)明專利]基于word2vec的相似站點(diǎn)獲取方法及系統(tǒng)在審
| 申請?zhí)枺?/td> | 201810443349.0 | 申請日: | 2018-05-10 |
| 公開(公告)號: | CN110489530A | 公開(公告)日: | 2019-11-22 |
| 發(fā)明(設(shè)計)人: | 黃天印;趙時閔;徐文潔 | 申請(專利權(quán))人: | 上海申通地鐵集團(tuán)有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/36;G06K9/62 |
| 代理公司: | 31283 上海弼興律師事務(wù)所 | 代理人: | 胡美強(qiáng);羅朗<國際申請>=<國際公布>= |
| 地址: | 200031*** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 站點(diǎn) 出行 余弦相似度 目標(biāo)站點(diǎn) 訓(xùn)練語料 站點(diǎn)獲取 向量 公共交通 客流數(shù)據(jù) 模型訓(xùn)練 數(shù)據(jù)構(gòu)建 向量計算 地鐵站 相似度 預(yù)設(shè) | ||
1.一種基于word2vec的相似站點(diǎn)獲取方法,其特征在于,所述相似站點(diǎn)獲取方法包括:
S1、獲取預(yù)設(shè)時間內(nèi)所有用戶乘坐公共交通的出行數(shù)據(jù),所述出行數(shù)據(jù)包括至少兩個站點(diǎn);
S2、提取每個用戶的出行數(shù)據(jù),并根據(jù)所述每個用戶的出行數(shù)據(jù)構(gòu)建所述每個用戶的站點(diǎn)訓(xùn)練語料;
S3、將所有用戶的站點(diǎn)訓(xùn)練語料輸入至word2vec模型訓(xùn)練得到每個站點(diǎn)的表示向量;
S4、根據(jù)任意兩個站點(diǎn)的表示向量計算得到所述任意兩個站點(diǎn)的余弦相似度;
S5、根據(jù)所述余弦相似度獲取與一目標(biāo)站點(diǎn)最相似的若干站點(diǎn)。
2.如權(quán)利要求1所述的基于word2vec的相似站點(diǎn)獲取方法,其特征在于,步驟S2具體包括:
S21、提取每個用戶的出行數(shù)據(jù);
S22、按照時間順序?qū)⑺雒總€用戶出行經(jīng)過的所有站點(diǎn)依次排列構(gòu)建成所述站點(diǎn)訓(xùn)練語料。
3.如權(quán)利要求1所述的基于word2vec的相似站點(diǎn)獲取方法,其特征在于,步驟S1具體包括:
S11、獲取預(yù)設(shè)時間內(nèi)所有用戶乘坐公共交通的交通卡刷卡數(shù)據(jù);
S12、提取所述交通卡刷卡數(shù)據(jù)中包含進(jìn)站數(shù)據(jù)和出站數(shù)據(jù)的數(shù)據(jù)生成所述出行數(shù)據(jù)。
4.如權(quán)利要求3所述的基于word2vec的相似站點(diǎn)獲取方法,其特征在于,所述預(yù)設(shè)時間包括至少一個預(yù)設(shè)周期,步驟S12具體包括:
S121、檢測任意一個預(yù)設(shè)周期內(nèi)任一用戶的所述交通卡刷卡數(shù)據(jù)中進(jìn)站數(shù)據(jù)的數(shù)量和出站數(shù)據(jù)的數(shù)量是否相同,若否,則濾除所述任意一個預(yù)設(shè)周期內(nèi)的所述任一用戶的交通卡刷卡數(shù)據(jù);
S122、從濾除后的交通卡刷卡數(shù)據(jù)中提取包含進(jìn)站數(shù)據(jù)和出站數(shù)據(jù)的數(shù)據(jù)生成所述出行數(shù)據(jù)。
5.一種基于word2vec的相似站點(diǎn)獲取系統(tǒng),其特征在于,所述相似站點(diǎn)獲取系統(tǒng)包括數(shù)據(jù)獲取模塊、數(shù)據(jù)提取模塊、訓(xùn)練語料構(gòu)建模塊、表示向量訓(xùn)練模塊、相似度計算模塊和相似站點(diǎn)獲取模塊;
所述數(shù)據(jù)獲取模塊用于獲取預(yù)設(shè)時間內(nèi)所有用戶乘坐公共交通的出行數(shù)據(jù),所述出行數(shù)據(jù)包括至少兩個站點(diǎn);
所述數(shù)據(jù)提取模塊用于提取每個用戶的出行數(shù)據(jù);
所述訓(xùn)練語料構(gòu)建模塊用于根據(jù)所述每個用戶的出行數(shù)據(jù)構(gòu)建所述每個用戶的站點(diǎn)訓(xùn)練語料;
所述表示向量訓(xùn)練模塊用于將所有用戶的站點(diǎn)訓(xùn)練語料輸入至word2vec模型訓(xùn)練得到每個站點(diǎn)的表示向量;
所述相似度計算模塊用于根據(jù)任意兩個站點(diǎn)的表示向量計算得到所述任意兩個站點(diǎn)的余弦相似度;
所述相似站點(diǎn)獲取模塊用于根據(jù)所述余弦相似度獲取與一目標(biāo)站點(diǎn)最相似的若干站點(diǎn)。
6.如權(quán)利要求5所述的基于word2vec的相似站點(diǎn)獲取系統(tǒng),其特征在于,所述訓(xùn)練語料構(gòu)建模塊用于按照時間順序?qū)⑺雒總€用戶出行經(jīng)過的所有站點(diǎn)依次排列構(gòu)建成所述站點(diǎn)訓(xùn)練語料。
7.如權(quán)利要求5所述的基于word2vec的相似站點(diǎn)獲取系統(tǒng),其特征在于,所述數(shù)據(jù)獲取模塊包括刷卡數(shù)據(jù)獲取單元和出行數(shù)據(jù)生成單元;
所述刷卡數(shù)據(jù)獲取單元用于獲取預(yù)設(shè)時間內(nèi)所有用戶乘坐公共交通的交通卡刷卡數(shù)據(jù);
所述出行數(shù)據(jù)生成單元用于提取所述交通卡刷卡數(shù)據(jù)中包含進(jìn)站數(shù)據(jù)和出站數(shù)據(jù)的數(shù)據(jù)生成所述出行數(shù)據(jù)。
8.如權(quán)利要求7所述的基于word2vec的相似站點(diǎn)獲取系統(tǒng),其特征在于,所述預(yù)設(shè)時間包括至少一個預(yù)設(shè)周期,所述數(shù)據(jù)獲取模塊還包括檢測單元和濾除單元;
所述檢測單元用于檢測任意一個預(yù)設(shè)周期內(nèi)任一用戶的所述交通卡刷卡數(shù)據(jù)中進(jìn)站數(shù)據(jù)的數(shù)量和出站數(shù)據(jù)的數(shù)量是否相同,若否,則調(diào)用所述濾除單元;
所述濾除單元用于濾除所述任意一個預(yù)設(shè)周期內(nèi)的所述任一用戶的交通卡刷卡數(shù)據(jù);
所述出行數(shù)據(jù)生成單元用于從濾除后的交通卡刷卡數(shù)據(jù)中提取包含進(jìn)站數(shù)據(jù)和出站數(shù)據(jù)的數(shù)據(jù)生成所述出行數(shù)據(jù)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海申通地鐵集團(tuán)有限公司,未經(jīng)上海申通地鐵集團(tuán)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810443349.0/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 一種移動通信站點(diǎn)規(guī)劃方法及系統(tǒng)
- 空鐵運(yùn)輸系統(tǒng)
- 多運(yùn)營商站點(diǎn)規(guī)劃方法及裝置
- 一種隨機(jī)接入方法及站點(diǎn)
- 一種公交過需站點(diǎn)的真實(shí)OD的分析方法
- 用于生成物聯(lián)網(wǎng)系統(tǒng)中的站點(diǎn)的配置文件的方法及裝置
- 基于大數(shù)據(jù)分析的配送站點(diǎn)建設(shè)系統(tǒng)及方法
- 一種公交中途站點(diǎn)名稱生成方法及裝置
- 一種公交站點(diǎn)名稱生成方法及裝置
- 一種基于大數(shù)據(jù)分析的配送站點(diǎn)建設(shè)方法
- 一種出行提醒方法及出行提醒裝置
- 一種出行提醒的方法及終端
- 一種基于導(dǎo)航的出行裝備推薦系統(tǒng)及方法
- 城市交通運(yùn)行狀態(tài)分析方法、裝置及電子設(shè)備
- 出行方案的推薦方法、裝置、設(shè)備及存儲介質(zhì)
- 一種出行方案規(guī)劃方法、裝置及可讀存儲介質(zhì)
- 一種多人出行導(dǎo)航方法、裝置、終端設(shè)備及存儲介質(zhì)
- 出行路線的推薦方法、系統(tǒng)、處理設(shè)備及可讀存儲介質(zhì)
- 一種出行方案規(guī)劃方法及相關(guān)設(shè)備
- 一種基于出行離散度及聚類的車輛引導(dǎo)方法、介質(zhì)及設(shè)備





