[發明專利]地理編碼實現方法和裝置有效
| 申請號: | 201310706024.4 | 申請日: | 2013-12-19 |
| 公開(公告)號: | CN103699623B | 公開(公告)日: | 2017-07-04 |
| 發明(設計)人: | 余曉龍 | 申請(專利權)人: | 百度在線網絡技術(北京)有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京品源專利代理有限公司11332 | 代理人: | 胡彬 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 地理 編碼 實現 方法 裝置 | ||
1.一種地理編碼實現方法,其特征在于,包括:
對地址信息進行拆分和語義解析,以獲取至少兩個子地址對應的信息點數據,包括:對所述地址信息進行語義解析,以獲得具有獨立地址語義的短語;基于信息點數據庫中的地理編碼規范關鍵詞和關聯區域關鍵詞,對短語進行信息點識別,與信息點匹配的短語作為基礎單元,與信息點不匹配的短語作為附加單元;將基礎單元,或所述基礎單元和后續的附加單元,合并為一個子地址信息;采用偏移量關鍵詞對所述子地址信息的附加單元進行識別,以確定所述子地址信息為精確子地址、模糊子地址或偏移子地址的信息點數據;模糊子地址和偏移子地址用于對精確子地址進行輔助定位;
根據獲取的至少兩個信息點數據,對所述地址信息對應的地理目標進行地理編碼。
2.根據權利要求1所述的方法,其特征在于,對所述地址信息進行語義解析,以獲得具有獨立地址語義的短語包括:
基于分詞數據庫將地址信息進行分詞處理,獲得具有獨立語義的詞語;
將詞語進行合并處理,獲得具有獨立地址語義的短語。
3.根據權利要求1所述的方法,其特征在于,采用偏移量關鍵詞對所述子地址信息的附加單元進行識別,以確定所述子地址信息為精確子地址、模糊子地址或偏移子地址的信息點數據包括:
采用偏移量關鍵詞對所述子地址信息的附加單元進行識別;
如果所述子地址信息不包括附加單元,則確定所述子地址信息對應于精確子地址的信息點數據;
如果所述子地址信息包括附加單元,且所述附加單元中包括偏移量,則根據所述子地址信息的基礎單元,以及所述附加單元中識別到的偏移量關鍵詞和偏移量,確定所述子地址信息為偏移子地址的信息點數據;
如果所述子地址信息包括附加單元,且所述附加單元中不包括偏移量,則根據所述子地址信息的基礎單元,以及所述附加單元中識別到的偏移量關鍵詞,確定所述子地址信息為模糊子地址的信息點數據。
4.根據權利要求1所述的方法,其特征在于,基于信息點數據庫中的地理編碼規范關鍵詞和關聯區域關鍵詞,對短語進行信息點識別包括:
如果識別到與信息點數據庫中的關聯區域關鍵詞匹配的短語時,根據所述關聯區域關鍵詞,基于信息點數據庫中的地理編碼規范關鍵詞對當前短語的前序短語進行識別,以獲取至少兩個關聯信息點;
根據至少兩個關聯信息點和關聯區域關鍵詞獲取關聯區域信息點。
5.根據權利要求1所述的方法,其特征在于,根據獲取的至少兩個信息點數據,對所述地址信息對應的地理目標進行地理編碼包括:
將精確子地址、模糊子地址和/或偏移子地址的信息點數據按照預設層級存儲為地址樹;和/或
根據精確子地址的信息點數據進行地理編碼,且根據所述模糊子地址和/或偏移子地址的信息點數據對地理編碼進行修正或校驗;和/或
如果根據精確子地址的信息點數據在數據庫中匹配至少兩個信息點時,根據所述模糊子地址和/或偏移子地址的信息點數據在所述至少兩個信息點中進行選擇。
6.一種地理編碼實現裝置,其特征在于,包括:
地址信息處理模塊,用于對地址信息進行拆分和語義解析,以獲取至少兩個子地址對應的信息點數據,包括:短語獲取單元,用于對所述地址信息進行語義解析,以獲得具有獨立地址語義的短語;短語匹配單元,用于基于信息點數據庫中的地理編碼規范關鍵詞和關聯區域關鍵詞,對短語進行信息點識別,與信息點匹配的短語作為基礎單元,與信息點不匹配的短語作為附加單元;子地址合并單元,用于將基礎單元,或所述基礎單元和后續的附加單元,合并為一個子地址信息;子地址識別單元,用于采用偏移量關鍵詞對所述子地址信息的附加單元進行識別,以確定所述子地址信息為精確子地址、模糊子地址或偏移子地址的信息點數據;模糊子地址和偏移子地址用于對精確子地址進行輔助定位;
地理編碼模塊,用于根據獲取的至少兩個信息點數據,對所述地址信息對應的地理目標進行地理編碼。
7.根據權利要求6所述的裝置,其特征在于,短語獲取單元具體用于:
基于分詞數據庫將地址信息進行分詞處理,獲得具有獨立語義的詞語;
將詞語進行合并處理,獲得具有獨立地址語義的短語。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于百度在線網絡技術(北京)有限公司,未經百度在線網絡技術(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310706024.4/1.html,轉載請聲明來源鉆瓜專利網。





