[發明專利]一種處理POI信息的方法和裝置在審
| 申請號: | 201710054812.8 | 申請日: | 2017-01-24 |
| 公開(公告)號: | CN108345609A | 公開(公告)日: | 2018-07-31 |
| 發明(設計)人: | 盧俊之;湯沛;季成暉;吳坤;孟凡超 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;H04L29/08 |
| 代理公司: | 北京三高永信知識產權代理有限責任公司 11138 | 代理人: | 朱雅男 |
| 地址: | 518057 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 詞語 方法和裝置 計算機技術領域 物理實體 接近度 匹配度 預設 | ||
本發明公開了一種處理POI信息的方法和裝置,屬于計算機技術領域。所述方法包括:獲取第一POI信息以及與所述第一POI信息滿足預設的接近度條件的第二POI信息,對所述第一POI信息中的第一場所名包含的詞語進行功能劃分,并對所述第二POI信息中的第二場所名包含的詞語進行功能劃分,根據所述第一場所名和所述第二場所名中具有相同功能的詞語的匹配度,確定所述第一POI信息和所述第二POI信息是否為同一物理實體的POI信息。采用本發明,可以提高處理POI信息的準確性。
技術領域
本發明涉及計算機技術領域,特別涉及一種處理POI信息的方法和裝置。
背景技術
網絡地圖的服務器可以通過技術人員實地勘測、從合作方獲取或者網絡爬取的方式,獲取到各物理實體的POI(Point of Information,信息點)信息。其中,物理實體可以是景點、商場、車站等具有固定位置屬性的地理場所,在地理信息系統中,一個POI可以是一棟房子、一個商鋪、一個郵筒、一個公交站等,POI信息可以包括物理實體的場所名、類別、地址、坐標(經緯度)、附近的飯店商鋪等多種信息。服務器可以根據POI信息在網絡地圖中相應的位置設置各物理實體對應的地圖標識,這樣,用戶可以通過地圖標識直接確定出物理實體的實際位置。而網絡地圖的服務器從不同途徑獲取到的不同POI信息可能指向同一個物理實體,因此,在生成地圖標識前,服務器需要對不同的POI信息進行同一性判斷,將判斷為同一物理實體的POI信息進行合并。具體的,服務器在進行同一性判斷時,可以先獲取有重復可能的兩個POI信息,然后通過文本相似判斷兩個POI信息是否指向同一物理實體。對于兩個POI信息均包含的信息,服務器可以按照預設規則選擇使用某一個POI信息中的信息,而對于僅一個POI信息包含的信息,則可以直接將該信息添加至合并后的POI信息中。
例如,技術人員實地勘測可能得到一個POI信息,其中的場所名為“AB路大眾假日酒店”,同時服務器可能從合作方獲取到一個POI信息,其中的場所名為“AB路大眾酒店”,而實際上這兩個POI信息是同一物理實體的POI信息,考慮到兩個POI信息的文本相似度較高,故而可以判定上述兩個POI信息指向同一物理實體,進一步的,“AB路大眾假日酒店”的POI信息中,包括場所名、地址、坐標、附近商家4種信息,“AB路大眾酒店”的POI信息中,包括場所名、地址、類別、坐標4種信息,對于“場所名”、“地址”和“坐標”這些兩個POI信息中都包含的信息,服務器可以選擇使用“AB路大眾假日酒店”中的信息,對于“附近商家”、“類別”這些只有一個POI信息包含的信息,可以將該信息添加至合并后的POI信息中。
在實現本發明的過程中,發明人發現現有技術至少存在以下問題:
由于命名方式的多樣性,有些情況采用文本相似的方式無法準確的判斷兩個POI信息是否指向同一物理實體,例如,對于a:“AC大眾假日休閑酒店溫泉”、b:“AC大眾假日休閑溫泉酒店”這兩個POI信息,a實際為某酒店下屬的溫泉的POI信息,b實際為某酒店的POI信息,然而根據文本相似判斷,a和b的相似度很高,則會認為a和b為同一物理實體的POI信息,故而處理POI信息的準確性較低。
發明內容
為了解決現有技術的問題,本發明實施例提供了一種處理POI信息的方法和裝置。所述技術方案如下:
第一方面,提供了一種處理POI信息的方法,所述方法包括:
獲取第一POI信息以及與所述第一POI信息滿足預設的接近度條件的第二POI信息;
對所述第一POI信息中的第一場所名包含的詞語進行功能劃分,并對所述第二POI信息中的第二場所名包含的詞語進行功能劃分;
根據所述第一場所名和所述第二場所名中具有相同功能的詞語的匹配度,確定所述第一POI信息和所述第二POI信息是否為同一物理實體的POI信息。
第二方面,提供了一種處理POI信息的裝置,所述裝置包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710054812.8/2.html,轉載請聲明來源鉆瓜專利網。





