[發明專利]基于互聯網分詞思想的車載導航POI搜索引擎無效
| 申請號: | 201010117242.0 | 申請日: | 2010-03-02 |
| 公開(公告)號: | CN101794307A | 公開(公告)日: | 2010-08-04 |
| 發明(設計)人: | 朱敦堯;黨魁 | 申請(專利權)人: | 光庭導航數據(武漢)有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G01C21/34 |
| 代理公司: | 湖北武漢永嘉專利代理有限公司 42102 | 代理人: | 王超 |
| 地址: | 430074 湖北省武漢市洪山*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 互聯網 分詞 思想 車載 導航 poi 搜索引擎 | ||
1.基于互聯網分詞思想的車載導航POI搜索引擎,其特征在于包括以下步驟:
1)對POI原數據中的POI名稱做分詞處理;
2)根據分詞結果生成POI搜索引擎信息索引;
3)根據POI搜索引擎信息索引進行POI名稱查詢。
2.根據權利要求1所述的方法,其特征在于步驟1)具體包括:
S101)從POI原數據中提取出POI的名稱;
S102)將提取出來的POI名稱保存為文本文件;
S103)將POI名稱做分詞處理:根據算法將文本文件中POI名稱的中文分割為小于等于最大分詞長度的中文關鍵詞;數字和英文單詞則各自分割為一個整體,分別生成數字關鍵詞和英文關鍵詞;并去除POI名稱中的符號;
S104)將POI名稱分詞處理后生成的小于等于最大分詞長度的中文關鍵詞、數字關鍵詞和英文關鍵詞保存為分詞結果。
3.根據權利要求1或2所述的方法,其特征在于步驟2)具體包括:
S201)將分詞結果中的關鍵詞生成首字母,其中中文關鍵詞的首字母為拼音首字母;數字關鍵詞的首字母為其本身;英文關鍵詞的首字母為其小寫字母;
S202)為分詞結果建立字符0~9和a~z的首字母倒排索引;
S203)根據分詞結果的關鍵詞在POI名稱中查找含有關鍵詞的POI記錄;
S204)將分詞結果關鍵詞查找的POI記錄在數據中的地址和記錄數量保存到該關鍵詞的倒排索引中,最后生成POI搜索引擎信息索引。
4.根據權利要求3所述的方法,其特征在于:POI搜索引擎信息索引包括管理部數據塊、首字母管理數據塊、首字母索引數據塊、關鍵詞數據塊、匹配結果索引數據塊和實體數據塊。
5.根據權利要求4所述的方法,其特征在于POI搜索引擎信息索引的各數據塊具體結構為:
1)管理部數據塊結構見表1:
表1管理部數據塊結構
2)首字母管理數據塊的結構見表2:
表2首字母管理數據塊結構
3)首字母索引數據塊的結構見表3:
表3首字母索引數據塊結構
4)關鍵詞數據塊的結構見表4:
表4關鍵詞數據塊結構
5)POI匹配結果索引數據塊的結構見表5:
表5POI匹配結果索引數據塊結構
6)POI實體數據塊的結構見表6:
表6POI實體數據塊結構
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于光庭導航數據(武漢)有限公司,未經光庭導航數據(武漢)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010117242.0/1.html,轉載請聲明來源鉆瓜專利網。





