[發明專利]一種數據融合方法及裝置在審
| 申請號: | 202010525808.7 | 申請日: | 2020-06-10 |
| 公開(公告)號: | CN111723172A | 公開(公告)日: | 2020-09-29 |
| 發明(設計)人: | 方碩;劉婧文;李城 | 申請(專利權)人: | 廣東世紀高通科技有限公司 |
| 主分類號: | G06F16/29 | 分類號: | G06F16/29;G06F16/21 |
| 代理公司: | 北京中博世達專利商標代理有限公司 11274 | 代理人: | 申健 |
| 地址: | 510000 廣東省廣州市天河區*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 數據 融合 方法 裝置 | ||
本發明公開了一種數據融合方法及裝置,涉及交通信息服務技術領域,解決了單個渠道獲取的POI地址信息存在覆蓋范圍不全、數據質量不高的問題。具體方案包括:數據融合裝置獲取至少兩種POI數據源中每種POI數據源的POI地址信息,得到初始POI地址信息集合,POI地址信息用于表示地理實體的位置信息;對初始POI地址信息集合包括的POI地址信息進行融合,得到目標POI地址信息集合,目標POI地址信息集合包括多條有效的目標POI地址信息;將目標POI地址信息集合包括的目標POI地址信息加載入地址信息數據庫。
技術領域
本發明涉及交通信息服務技術領域,尤其涉及一種數據融合方法及裝置。
背景技術
興趣點(point of interest,POI)地址信息是對具體的地理實體的標注,代表著該地理實體的特定地理位置。實際應用中,POI地址信息與經濟社會活動和人民群眾日常生活密切相關,涉及經濟生活、社會交往、城市建設和治安管理等諸多方面。
在相關技術中,一個地理實體的POI地址信息可以從不同的渠道獲取,例如,可以從公安網、互聯網應用等獲取。但是,單個渠道獲取的POI地址信息均存在覆蓋范圍不全、數據質量不高的問題。
發明內容
本發明提供一種數據融合方法及裝置,解決了單個渠道獲取的POI地址信息存在覆蓋范圍不全、數據質量不高的問題。
為達到上述目的,本發明采用如下技術方案:
第一方面,本發明提供一種數據融合方法,該方法包括:數據融合裝置獲取至少兩種POI數據源中每種POI數據源的POI地址信息,得到初始POI地址信息集合,POI地址信息用于表示地理實體的位置信息;對初始POI地址信息集合包括的POI地址信息進行融合,得到目標POI地址信息集合,目標POI地址信息集合包括多條有效的目標POI地址信息;將目標POI地址信息集合包括的目標POI地址信息加載入地址信息數據庫。
結合第一方面,在一種可能的實現方式中,對初始POI地址信息集合包括的POI地址信息進行融合,得到目標POI地址信息集合,具體可以包括:對初始POI地址信息集合包括的POI地址信息進行清洗和加工,得到候選POI地址信息集合;將候選POI地址信息集合包括的每條POI地址信息按照預設地址結構進行轉換,得到目標POI地址信息集合。
結合第一方面和上述可能的實現方式,在另一種可能的實現方式中,對初始POI地址信息集合包括的POI地址信息進行清洗和加工,得到候選POI地址信息集合,具體可以包括:將初始POI地址信息集合按照行政區劃等級進行分類,去除每類POI地址信息中的異常POI地址信息,得到第一POI地址信息集合;將第一POI地址信息集合包括的每條POI地址信息進行切分,得到多個切片信息;確定多個切片信息中的異常切片信息,去除第一POI地址信息集合中包含異常切片信息的POI地址信息,得到第二POI地址信息集合;對第二POI地址信息集合進行清洗和加工,得到候選POI地址信息集合。
結合第一方面和上述可能的實現方式,在另一種可能的實現方式中,對第二POI地址信息集合進行清洗和加工,得到候選POI地址信息集合,具體可以包括:從去除異常切片信息后的切片信息中獲取地理實體的名稱,并將第二POI地址信息集合中,包含相同名稱的所有POI地址信息進行清洗和加工,得到候選POI地址信息集合。
結合第一方面和上述可能的實現方式,在另一種可能的實現方式中,對第二POI地址信息集合進行清洗和加工,得到候選POI地址信息集合,具體可以包括:在去除異常切片信息后的切片信息中,將表示同一地理實體的切片信息合并為分詞,并將包含分詞的POI地址信息進行合并;確定分詞的類型,并根據分詞的類型,對合并后的POI地址信息進行清洗和加工,得到候選POI地址信息集合。
結合第一方面和上述可能的實現方式,在另一種可能的實現方式中,還包括:響應于用戶的輸入操作,在地址信息數據庫中按照預設地址結構,增加POI地址信息。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣東世紀高通科技有限公司,未經廣東世紀高通科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010525808.7/2.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





