[發明專利]基于模糊匹配的地址標準化方法、系統、設備及介質在審
| 申請號: | 201911094604.6 | 申請日: | 2019-11-11 |
| 公開(公告)號: | CN110795472A | 公開(公告)日: | 2020-02-14 |
| 發明(設計)人: | 崔晶晶;張建東 | 申請(專利權)人: | 集奧聚合(北京)人工智能科技有限公司 |
| 主分類號: | G06F16/2458 | 分類號: | G06F16/2458;G06F16/29 |
| 代理公司: | 11617 北京瑞盛銘杰知識產權代理事務所(普通合伙) | 代理人: | 李績 |
| 地址: | 100024 北京市朝*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 地址節點 地址標準化 地址參數 偏移 企業核心競爭力 企業運營成本 經緯度 互聯網服務 定位請求 訂單處理 獲取地址 接收用戶 模糊匹配 用戶定位 真實地址 相似度 快遞 預設 調用 標準化 返回 服務 | ||
本發明提供了一種基于模糊匹配的地址標準化方法、系統、設備及介質,所述方法包括:接收用戶定位請求并從用戶定位請求中獲取地址參數;調用高德API及本地標準化ES庫,獲取與所述地址參數相似度較高的預設數量的地址節點;計算各所述地址節點與所述地址參數對應經緯度的距離偏移值;選取所述距離偏移值中最小值對應的地址節點作為真實地址并返回給用戶。利用本發明實施,在外賣、同城服務、快遞等派件互聯網服務中實現了地址標準化,提高了企業訂單處理效率,降低企業運營成本,增強了企業核心競爭力。
技術領域
本發明涉及意圖標簽篩選技術領域,特別涉及一種基于模糊匹配的地址標準化方法、系統、設備及介質。
背景技術
隨著電商、外賣、上門生活服務等平臺的崛起,地址缺失、地址錯誤等層出不窮,地址如何修正并標準化是企業急需解決的問題之一。一般地,企業地址標準化存在以下幾個問題:
1)地址數據分散,人工關聯分析效率低、效果差。
2)企業內部與外部均存在數據孤島問題。
3)地址缺失、地址異常等問題較難識別、分析。
發明內容
為解決上述技術問題,本發明提供了一種基于模糊匹配的地址標準化方法、系統、設備及介質。
本發明一方面提供了一種基于模糊匹配的地址標準化方法,所述基于模糊匹配的地址標準化方法包括:
接收用戶定位請求并從用戶定位請求中獲取地址參數;
調用高德API及本地標準化ES庫,獲取與所述地址參數相似度較高的預設數量的地址節點;
計算各所述地址節點與所述地址參數對應經緯度的距離偏移值;
選取所述距離偏移值中最小值對應的地址節點作為真實地址并返回給用戶。
在一個實施例中,所述調用高德API及本地標準化ES庫,獲取與所述地址參數相似度較高的預設數量的地址節點,包括:
調用高德開放平臺地址編碼API,獲取所述地址參數所屬的行政區劃編碼、經緯度及地址等級;
判斷所述地址等級對應字段是否為省、市、區縣或未知;
如所述地址等級對應字段不為省、市、區縣及未知中的任一種,利用所述行政區劃編碼在所述ES地址庫中搜索預設數量的與所述地址參數匹配度較高的地址節點。
在一個實施例中,所述調用高德API及本地標準化ES庫,獲取與所述地址參數相似度較高的預設數量的地址節點,還包括利用中文分詞法獲取與所述地址參數相似度較高的預設數量的地址節點,具體包括:
解析所述地址參數以獲取所述地址參數對應的行政區劃,所述行政區劃包括省、直轄市、市、區縣和詳細地址部分中的至少一種;
根據所述行政區劃查找對應的省市區內地址節點,通過中文分詞將詳細地址與ES地址庫中的數據進行匹配,計算文本相似度;
選取文本相似度較高的預設數量的地址節點。
在一個實施例中,如所述地址等級對應字段為省、市、區縣及未知中的任一種時,利用所述中文分詞法獲取與所述地址參數相似度較高的預設數量的地址節點。
本發明另一方面還提供了一種基于模糊匹配的地址標準化系統,所述系統包括:
數據接收單元,用于接收用戶定位請求并從用戶定位請求中獲取地址參數;
匹配單元,用于調用高德API及本地標準化ES庫,獲取與所述地址參數相似度較高的預設數量的地址節點;
偏移計算單元,用于計算各所述地址節點與所述地址參數對應經緯度的距離偏移值;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于集奧聚合(北京)人工智能科技有限公司,未經集奧聚合(北京)人工智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911094604.6/2.html,轉載請聲明來源鉆瓜專利網。





