[發明專利]POI融合閾值的確定方法、裝置和電子設備在審
| 申請號: | 202011182458.5 | 申請日: | 2020-10-29 |
| 公開(公告)號: | CN112214568A | 公開(公告)日: | 2021-01-12 |
| 發明(設計)人: | 李明凱;張明飛 | 申請(專利權)人: | 沈陽美行科技有限公司 |
| 主分類號: | G06F16/29 | 分類號: | G06F16/29;G06F16/9537 |
| 代理公司: | 北京知呱呱知識產權代理有限公司 11577 | 代理人: | 彭伶俐 |
| 地址: | 110000 遼寧省沈*** | 國省代碼: | 遼寧;21 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | poi 融合 閾值 確定 方法 裝置 電子設備 | ||
本發明實施例公開了POI融合閾值的確定方法、裝置和電子設備,該方法包括:獲取第一數據提供商提供的第一全量數據集和第二提供商提供的第二全量數據集;對第一全量數據集和第二全量數據集進行數據格式統一得到標準第一數據集和標準第二數據集;對標準第一數據集和標準第二數據集確定主POI源和候選POI源;對主POI源和候選POI源進行融合得到第一POI融合集;根據第一POI融合集確定最小距離和檢索距離;根據檢索距離閾值和第一POI融合集得到第二POI融合集;根據最小距離、預設的半徑增長量,以及第二POI融合集中主POI和匹配的候選POI確定匹配距離閾值。本發明融合效率高,準確度高。
技術領域
本發明實施例涉及數據融合領域,具體涉及POI(Point of Information,信息點)融合閾值的確定方法、裝置和電子設備。
背景技術
隨著社會的快速發展,各種數據出現了爆炸式的增長。隨之而來的,在不同的社會領域中產生了多家數據提供商,他們將自己涉足的領域進行數據整合,對外提供數據服務。
面對社會存在的眾多領域,同一領域下又有多家數據提供商,如何將他們提供的數據進行整合就變成了一個系統而復雜的問題。單純采用人工的方式進行數據整合不僅產能低下,而且人工成本也會非常高。
發明內容
本發明實施例的目的在于提供POI融合閾值的確定方法、裝置和電子設備,用以解決現有數據提供商提供的數據難以融合,人工融合成本高、效率低的問題。
為實現上述目的,本發明實施例主要提供如下技術方案:
第一方面,本發明實施例提供了一種POI融合閾值的確定方法,包括:
獲取第一數據提供商提供的第一全量數據集和第二提供商提供的第二全量數據集;
對所述第一全量數據集和所述第二全量數據集進行數據格式統一得到標準第一數據集和標準第二數據集;
對所述標準第一數據集和所述標準第二數據集確定主POI源和候選POI源;
對所述主POI源和所述候選POI源進行融合得到第一POI融合集;
根據所述第一POI融合集確定最小距離和檢索距離閾值;
根據所述檢索距離閾值和所述第一POI融合集得到第二POI融合集;
根據所述最小距離、預設的半徑增長量,以及所述第二POI融合集中主POI和候選POI確定匹配距離閾值;
其中,主POI源為POI融合集內兩個POI數據源中,任意所指定其中一個POI數據源;候選POI源為POI融合集內兩個POI數據源中,主POI源以外的另一個POI數據源;兩者共同構建成POI融合集。
根據本發明的一個實施例,根據所述第一POI融合集確定最小距離和檢索距離閾值,包括:
從所述第一POI融合集中獲取所有主POI及其匹配的候選POI;
計算所述第一POI融合集中的所有主POI及其匹配的候選POI的距離,從所有計算出的距離中確定所述最小距離和最大距離;
根據所述最大距離和預設的膨脹系數確定所述檢索距離閾值;
其中,所述主POI為所在數據源中的一個對象,所述候選POI為所在數據源中一個候選對象。
根據本發明的一個實施例,所述根據所述最小距離、預設的半徑增長量,以及所述第二POI融合集中主POI和候選POI確定匹配距離閾值,包括:
以所述最小距離為起點,以所述檢索距離閾值為終點,從所述起點開始按照所述預設的半徑增長量依次遞增取值,直到所述終點為止,產生的數值集合定義為半徑集合;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于沈陽美行科技有限公司,未經沈陽美行科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011182458.5/2.html,轉載請聲明來源鉆瓜專利網。





