[發明專利]一種異構地址標準轉換及匹配方法有效
| 申請號: | 201710016546.X | 申請日: | 2017-01-10 |
| 公開(公告)號: | CN106874384B | 公開(公告)日: | 2020-12-04 |
| 發明(設計)人: | 張宏利 | 申請(專利權)人: | 航天精一(廣東)信息科技有限公司 |
| 主分類號: | G06F16/29 | 分類號: | G06F16/29 |
| 代理公司: | 廣州圣理華知識產權代理有限公司 44302 | 代理人: | 頓海舟;李唐明 |
| 地址: | 510000 廣東省廣州市天河區天河科技園高新*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 地址 標準 轉換 匹配 方法 | ||
一種異構地址標準轉換及匹配方法,包括正向匹配、反相匹配、歸屬匹配,所述正向匹配包括信息點匹配和詳址匹配,并結合行政區劃補全和標準化字段處理的方法對地址信息進行標準化處理。本發明采用多級的匹配方法和設置了返回流程,對單一關聯和多種關聯的結果進行有效區分,容錯率更高,可適應不同行業的對地址的要求,匹配的精確度高。
技術領域
本發明屬于地理信息領域,涉及一種異構地址標準轉換及匹配方法。
背景技術
隨著大數據的發展,地址云平臺是基于空間標準地址的對外應用、服務平臺,實現了業務數據的實時抽取、清洗、匹配、上圖,系統通過正向、反向匹配,實現了業務數據全上圖,并對上圖后的業務數據進行專題制圖與發布,服務于各行各業對地圖的個性化需求,打造各行業的專屬地圖。地址匹配是將文字性的描述地址與其空間的地理位置坐標建立起對應關系的過程。地址匹配服務按照特定的步驟為地址查找匹配對象。首先要將地址標準化;然后服務器搜索地址匹配參考數據,查找潛在的位置;根據與地址的接近程度為每個候選位置指定分值,最后用分值最高的來匹配這個地址。
CN 105005577公開了一種地址匹配方法,其采取分層漸進式的匹配方法,具體包括快速匹配、經緯度匹配、模糊匹配和人工判定四個步驟,快速匹配對高質量目標地址進行精確匹配,運用鏈式補充機制適當補充匹配;經緯度匹配依據地圖服務提供商提供的經緯度信息對目標地址和其鄰近小區進行匹配;模糊匹配運用模糊索引對目標地址和相似小區進行匹配;人工判定機制對匹配的結果進行檢驗和把關。該發明其還包括地址分詞技術和地址匹配準確性的信心指數機制。該發明雖然運用了多重地址匹配技術復合運用問題,但為對地址進行標準化處理,因此難以適應不同領域對地址的需求。
發明內容
本發明提供了一種異構地址標準轉換及匹配方法,以解決地址難以標準化、適應性不強、準確率不高的不足。
為實現上述目的,本發明提供了一種異構地址標準轉換及匹配方法,包括如下步驟:
步驟1:驗證數據合法性:若數據合法則執行步驟S2,否則,直接拋出異常,執行結束;
步驟2:判斷數據正向匹配,若是則得到匹配行政區劃信息標識,并進行正向匹配;若數據不滿足正向匹配,則進行反向匹配;
步驟3:判斷步驟2中的正向匹配或反向匹配的結果是否為空,若匹配結果為空則拋出異常,執行結束;若匹配結果不為空,則得到匹配結果信息數據;
步驟4:根據步驟3中的匹配結果信息數據判斷是否匹配管理轄區,若滿足則進行歸屬匹配再返回結果;否則直接返回結果,執行結束。
優選的,所述正向匹配的具體步驟依次為:
S11:根據傳入的數據詳址信息、省市區縣信息驗證數據的合法性,若數據合法則進行步驟S12;若數據不合法,直接拋出異常,執行結束;
S12:將數據進行劃分為信息點、詳址信息數據、省市區縣等其他條件的信息數據;若數據為省市區縣的信息數據則進行行政區劃補全和標準化字段處理;
S13:根據步驟S12判斷傳入的數據是否同時沒有信息點和詳址;若傳入的數據同時沒有信息點和詳址,則執行沒有詳址和信息點處理并返回結果;若傳入的數據為信息點或詳址信息,則相應地執行信息點匹配或詳址匹配。
進一步的,所述行政區劃補全和標準化字段處理的步驟依次為:
S121:將傳入數據進行拼接組裝查詢地址,所述地址包括省市區縣、鄉鎮、居委會、街路巷;
S122:拆分所述拼接的地址,得到對應詞組;
S123:以所選行政區劃為準,解決行政區劃沖突問題;
S124:執行Solr地址查詢,對省市區縣字段補全,得到分詞后標準化的詞組列表。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于航天精一(廣東)信息科技有限公司,未經航天精一(廣東)信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710016546.X/2.html,轉載請聲明來源鉆瓜專利網。





