[發明專利]興趣點判重方法、裝置、設備和存儲介質有效
| 申請號: | 202010084328.1 | 申請日: | 2020-02-10 | 
| 公開(公告)號: | CN113255398B | 公開(公告)日: | 2023-08-18 | 
| 發明(設計)人: | 沈瀲;宋寬;謝紅偉 | 申請(專利權)人: | 百度在線網絡技術(北京)有限公司 | 
| 主分類號: | G06V30/422 | 分類號: | G06V30/422;G06F40/263;G06V30/146 | 
| 代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 孟金喆 | 
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 | 
| 權利要求書: | 查看更多 | 說明書: | 查看更多 | 
| 摘要: | |||
| 搜索關鍵詞: | 興趣 點判重 方法 裝置 設備 存儲 介質 | ||
本申請實施例公開了一種興趣點判重方法、裝置、設備和存儲介質,涉及地圖數據處理技術領域。具體實現方案為:根據至少兩個興趣點的候選語種名稱,從候選語種中確定目標語種以及所述至少兩個興趣點的目標語種名稱;基于所述目標語種的相似度計算模型,根據所述至少兩個興趣點的目標語種名稱,確定所述至少兩個興趣點是否屬于同一興趣點。通過對待比較的多個興趣點的名稱進行所屬語種的區分,綜合確定興趣點名稱在不同語種下的相似度,提高相似度計算的準確率以及地圖國際化數據中跨語種處理的泛化能力,為興趣點判重提供了有效依據。
技術領域
本申請實施例涉及數據處理技術領域,尤其涉及地圖數據處理技術領域,具體涉及一種興趣點判重方法、裝置、設備和存儲介質。
背景技術
在處理海量的地圖興趣點情報數據時,需要判別不同的情報數據是否描述為同一個興趣點。目前對于地圖國際化數據,現有技術對于跨語言興趣點判重的適用性較差,相似度計算的準確率較低。
發明內容
本申請實施例提供了一種興趣點判重方法、裝置、設備和存儲介質,能夠提高跨語言地圖興趣點判重的準確性。
第一方面,本申請實施例提供了一種興趣點判重方法,包括:
根據至少兩個興趣點的候選語種名稱,從候選語種中確定目標語種以及所述至少兩個興趣點的目標語種名稱;
基于所述目標語種的相似度計算模型,根據所述至少兩個興趣點的目標語種名稱,確定所述至少兩個興趣點是否屬于同一興趣點。
上述申請中的一個實施例具有如下優點或有益效果:通過對待比較的多個興趣點的名稱進行所屬語種的區分,綜合確定興趣點名稱在不同語種下的相似度,提高相似度計算的準確率以及地圖國際化數據中跨語種處理的泛化能力,為興趣點判重提供了有效依據。
可選的,所述根據至少兩個興趣點的候選語種名稱,從候選語種中確定目標語種,包括:
對所述至少兩個興趣點的候選語種名稱進行語種識別,確定所述候選語種名稱所屬的候選語種;
若所述至少兩個興趣點中包括相同候選語種的候選語種名稱,則確定所述相同候選語種作為待比較的目標語種。
上述申請中的一個實施例具有如下優點或有益效果:通過對待比較的多個興趣點的候選語種名稱進行語種識別,有利于區分待比較的目標語種,為多語種下興趣點名稱的比較提供依據。
可選的,所述對所述至少兩個興趣點的候選語種名稱進行語種識別,確定所述候選語種名稱所屬的候選語種,包括:
確定所述候選語種名稱的統一碼,以及所述統一碼在統一碼表中的編碼區域;
根據所述統一碼表中編碼區域與語種之間的映射關系,將所述編碼區域所屬的語種,確定為所述候選語種名稱所屬的候選語種。
上述申請中的一個實施例具有如下優點或有益效果:通過對候選語種名稱的統一碼,借助于統一碼表中編碼區域與語種之間的映射關系,有利于快速對多個興趣點的候選語種名稱進行語種識別。
可選的,所述基于所述目標語種的相似度計算模型,根據所述至少兩個興趣點的目標語種名稱,確定所述至少兩個興趣點是否屬于同一興趣點,包括:
基于所述目標語種的相似度計算模型,根據所述至少兩個興趣點的目標語種名稱,確定所述目標語種下所述至少兩個興趣點之間的相似度;
根據不同目標語種下所述至少兩個興趣點之間的相似度,確定所述至少兩個興趣點之間的整體名稱相似度;
根據所述至少兩個興趣點之間的整體名稱相似度,確定所述至少兩個興趣點是否屬于同一興趣點。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于百度在線網絡技術(北京)有限公司,未經百度在線網絡技術(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010084328.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種多功能手持裝置
 - 下一篇:一種213nm激光器
 





