[發明專利]基于多源數據融合的公交站點位置修復方法有效
| 申請號: | 202110493965.9 | 申請日: | 2021-05-07 |
| 公開(公告)號: | CN113392987B | 公開(公告)日: | 2022-10-14 |
| 發明(設計)人: | 王兆任;楊若松 | 申請(專利權)人: | 杭州數知夢科技有限公司 |
| 主分類號: | G06Q10/00 | 分類號: | G06Q10/00;G06Q50/30;G06F16/28;G06F16/29;G06F16/903;G06K9/62;G08G1/123 |
| 代理公司: | 杭州龍華專利代理事務所(特殊普通合伙) 33302 | 代理人: | 韓斐 |
| 地址: | 310052 浙江省杭州市濱*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 數據 融合 公交 站點 位置 修復 方法 | ||
1.一種基于多源數據融合的公交站點位置修復方法,其特征在于,包括以下步驟,
步驟一,從若干數據源處獲取基礎數據,分類匯總并存儲到數據庫中;
步驟二,獲取每條線路的起末站,根據起末站中文名稱的唯一性,對線路方向進行匹配, 在步驟二中,采用字符串編輯距離法對線路方向進行匹配;
在步驟二中,
對于每一份不同源數據的線路起末站合成為一個線路方向,遍歷所有線路站點數據獲取中文線路方向的集合;
按照中文線路方向對數據進行分組;
遍歷多個數據源的公交靜態站點數據,取出各個數據源的線路方向和相同線路方向下的線路名,根據字符串編輯距離遍歷兩邊線路名進行匹配,給出字符串編輯距離dis1,同時,使用正則方法,取出線路名中的數字,對兩邊數字進行編輯距離計算,獲得dis2,之后設定一個可靠性定量權重值,用于衡量兩邊線路名的匹配可靠性,可靠性權重計算方法如下:
Reliability=dis2 * A + dis1;
當Reliability= 0 時,兩邊線路名和方向完全一致匹配,A為設定值;
當0Reliability 設定值A時,兩邊數據的線路編號一致,對同一個線路方向,兩邊線路各做笛卡爾積,更新Reliability,采用公交靜態站點數據作為主表,取同一個線路方向和線路名下,其他源數據線路名Reliability最小的線路進行匹配;
當Reliability設定值A時,給出備選線路,經由人工介入,標記數據線路匹配情況;
最終,獲得線路和線路方向匹配關系表;
步驟三,在獲得了匹配關系表之后,將各個數據源的公交靜態站點進行匹配,關聯字段包括,線路名、首末站方向名和站點名,以公交數據為主表關聯上各個數據源的經緯度;
步驟四,將公交交易數據與GPS融合,擴展交易數據中的經緯度坐標,再通過班次數據過濾出有效數據;
步驟五,在得到交易數據信息之后,根據每個站臺位置附近的交易量確定數據來源的站點位置是最可靠的站點位置。
2.根據權利要求1所述的基于多源數據融合的公交站點位置修復方法,其特征在于,在所述步驟一中,通過數據庫取出公交靜態站點表,獲得最近若干天的公交交易數據、班次數據及GPS數據;在各個渠道的公交靜態站點位置數據獲取之后,對數據進行對應處理,采用文本相似度法將公交靜態站點與異源地圖數據的公交靜態站點位置進行對應。
3.根據權利要求1所述的基于多源數據融合的公交站點位置修復方法,其特征在于,線路和線路方向匹配關系表中的表字段包括:公交數據線路名、公交數據線路方向、異源地圖數據一的線路名、異源地圖數據一的線路方向、公交異源地圖數據一匹配可靠性、異源地圖數據二線路名、異源地圖數據二線路方向和公交異源地圖數據二匹配可靠性,因為公交數據作為主表,保留主表全部數據,如果按照關聯條件,次表內容與主表關聯上,則寫入次表數據;如關聯不上,則次表對應內容為空。
4.根據權利要求1所述的基于多源數據融合的公交站點位置修復方法,其特征在于,在所述步驟四中包括以下子步驟:
首先,取若干天的GPS數據與交易數據,將交易數據與GPS進行關聯,為每一筆交易,找到最近若干秒鐘內時間最接近的GPS位置,作為每筆交易數據的位置信息;
之后,保留車輛班次內GPS與交易數據作為冗余數據;
最終,得到包含以下字段的數據:車、線路、方向、用戶、交易時間、經度和緯度。
5.根據權利要求1所述的基于多源數據融合的公交站點位置修復方法,其特征在于,遍歷每一個公交站點,根據若干線路站點位置的信息,計算每個站點位置設定距離內發生的交易數據量,取總交易量最大的位置作為修正位置,得出最終結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州數知夢科技有限公司,未經杭州數知夢科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110493965.9/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種公交骨干線路抓取方法
- 下一篇:一種建筑用高性能混凝土及其制造方法
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





