[發明專利]一種地址查詢串解析方法及裝置有效
| 申請號: | 201410174465.9 | 申請日: | 2014-04-28 |
| 公開(公告)號: | CN105022747B | 公開(公告)日: | 2019-12-03 |
| 發明(設計)人: | 郭濤 | 申請(專利權)人: | 高德軟件有限公司 |
| 主分類號: | G06F16/29 | 分類號: | G06F16/29;G06F16/9537 |
| 代理公司: | 11690 北京領科知識產權代理事務所(特殊普通合伙) | 代理人: | 張丹<國際申請>=<國際公布>=<進入國 |
| 地址: | 102200 北京市昌*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 地址查詢 修正 子串 解析 地理位置搜索 地理信息系統 地址搜索 解析結果 通過模式 | ||
本發明涉及地理位置搜索技術領域,尤其涉及一種地址查詢串解析方法及裝置,用以解決現有技術中在地址搜索結果不準確的問題。所述方法包括:獲取用戶輸入的地址查詢串并通過地理信息系統GEO解析,得到地址串;將所述地址串中地址成分和非地址成分通過模式識別進行修正,得到修正地址查詢串;根據所述修正地址查詢串分別構造一級子串和二級子串,作為解析結果。
技術領域
本發明涉及地理位置搜索技術領域,尤其涉及一種地址查詢串解析方法及裝置。
背景技術
現有地址搜索已經是人們使用地圖產品的重要業務。通過地址搜索,人們可以實現對特定目的地、生活類服務、路途規劃的應用需求。
然而地址搜索具備自身的特殊性。在地圖搜索引擎中,POI(Point of Interest,興趣點)等數據在建立倒排索引時,是以空間來區分的。找到正確的空間范圍來檢索用戶的需求至關重要。
通常,在地圖搜索時,用戶不會自己指定出空間范圍。對空間范圍的解析往往需要通過計算機分析用戶的查詢串來得到。在解析出空間范圍之后,還需要從用戶的查詢串中提取出用戶真正想要搜索的POI(或者地址),再能在正確的空間范圍檢索出用戶真實的搜索需求。簡而言之,就是需要計算機分析出用戶“想在什么地方”搜素“什么東西”,又稱之為“where what”解析問題。
例如,用戶查詢“北京市朝陽區阜通東大街方恒國際中心”,用戶是期望在“北京市朝陽區阜通東大街”的范圍內搜索“方恒國際中心”,而現有的地址搜索并不能準確的解析出用戶查詢意圖,通常會在“北京市”的范圍內搜索“朝陽區阜通東大街方恒國際中心”,不能準確的得到搜索結果,用戶體驗不好。亟需要一種可以準確分析出查詢串中的where信息和what信息,從而在正確的空間范圍查詢找正確的內容串,以提升搜索質量。
發明內容
本發明實施例提供一種地址查詢串解析方法及裝置,用以解決現有技術中在地址搜索結果不準確的問題。
本發明實施例提供一種地址查詢串解析方法,該方法包括:
獲取用戶輸入的地址查詢串并通過地理信息系統GEO解析,得到地址串;
將所述地址串中地址成分和非地址成分通過模式識別進行修正,得到修正地址查詢串;
根據所述修正地址查詢串分別構造一級子串和二級子串,作為解析結果。
所述方法還包括:
根據預先設定的過濾詞表,過濾所述一級子串和二級子串中非地址成分,將過濾后的所述一級子串和二級子串作為解析結果。
所述過濾所述一級子串和二級子串中非地址成分,包括:
確定所述非地址成分是否命中所述過濾詞表,若是,直接過濾;否則,繼續如下步驟;
確定所述非地址成分是否為類別詞,若是,直接過濾;否則,繼續如下步驟;
確定所述非地址成分是否為門址類詞,若是,直接過濾;否則,不過濾。
所述分別構造一級子串和二級子串,包括:
獲取所述修正地址查詢串中區縣級別的空間信息和最小地址片段的空間信息;
在所述區縣級別的空間信息范圍搜索區縣級別以下的查詢串片段,作為一級子串;
在所述最小地址片段的空間信息范圍搜索最小地址片段之后的查詢串片段,作為二級子串。
所述將所述地址串中地址成分和非地址成分通過模式識別進行修正,包括:
獲取所述地址成分前的非地址成分mstart和地址成分后的非地址成分mend;
通過模式識別,判斷所述mstart和mend是否為重要;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于高德軟件有限公司,未經高德軟件有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410174465.9/2.html,轉載請聲明來源鉆瓜專利網。





