[發明專利]一種判斷地址是否標準化、地址標準化的方法及系統有效
| 申請號: | 201910314344.2 | 申請日: | 2019-04-18 |
| 公開(公告)號: | CN110147418B | 公開(公告)日: | 2022-04-29 |
| 發明(設計)人: | 周成祖;洪亞杰;陳志飛;連志陽;王海濱 | 申請(專利權)人: | 廈門市美亞柏科信息股份有限公司 |
| 主分類號: | G06F16/29 | 分類號: | G06F16/29 |
| 代理公司: | 廈門福貝知識產權代理事務所(普通合伙) 35235 | 代理人: | 郝學江 |
| 地址: | 361000 福建省廈門市*** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 判斷 地址 是否 標準化 方法 系統 | ||
1.一種判斷地址是否標準化的方法,其特征在于,包括以下步驟:
S1:將采集地址進行清洗轉換,其中所述采集地址中的漢語數字轉換為阿拉伯數字;
S2:按地址層級進行所述采集地址的拆分;
S3:對所述采集地址拆分后各個層級分別與標準地址庫中的地址進行命中分析;
S4:利用每個所述層級的命中情況、預設的層級權重系數和所述層級之間的影響系數,獲得所述采集地址的地址分值,所述層級的所述地址分值具體表現為所述層級的命中情況與所述層級的綜合系數的乘積,所述綜合系數具體表現為所述層級的所述權重系數和所述影響系數之和,所述地址分值的計算公式為其中si表示i層級對應的權重系數,xi表示i層級的地址段是否命中,xj表示j層級的地址段是否命中,取值為:0表示未命中、1表示命中,aij表示第j層級是否命中對i層級的所述權重系數si的影響系數;
S5:利用所述采集地址的地址分值與預設的分值閾值比較,判斷所述采集地址是否完成地址標準化。
2.根據權利要求1所述的一種判斷地址是否標準化的方法,其特征在于,所述步驟S4中的每個所述層級的所述權重系數不同,并且所述權重隨所述層級的遞增而增大。
3.根據權利要求1所述的一種判斷地址是否標準化的方法,其特征在于,所述層級之間的影響系數具體表現為其他層級與所述標準庫的命中對當前層級的所述權重系數的影響程度,所述其他層級與所述當前層級間隔越大,所述影響系數越小。
4.根據權利要求3所述的一種判斷地址是否標準化的方法,其特征在于,所述權重系數和所述影響系數均采用百分數的形式。
5.根據權利要求1所述的一種判斷地址是否標準化的方法,其特征在于,所述采集地址的所述地址分值具體包括每個所述層級的所述地址分值之和。
6.根據權利要求1所述的一種判斷地址是否標準化的方法,其特征在于,所述步驟S3的命中分析具體包括:利用路名+門牌號在所述標準庫中進行匹配,獲得命中的標準地址集合Rn,根據所述采集地址的室號在所述標準地址集合Rn中進行命中分析。
7.根據權利要求6所述的一種判斷地址是否標準化的方法,其特征在于,所述步驟S3的命中分析還包括利用拆分獲得與所述路名匹配命中的標準地址集合Pn,提取所述采集地址中所述門牌號和/或所述室號之前的數字與所述標準地址集合Pn進行命中分析。
8.根據權利要求1所述的一種判斷地址是否標準化的方法,其特征在于,所述步驟S5具體為利用計算出的所述地址分值S與預設的所述分值閾值LS進行比對,若S>LS,表示所述采集地址的標準化成功,若S<LS,表示所述采集地址的標準化失敗。
9.一種地址標準化的方法,包括權利要求1至8中任一項所述的方法,其特征在于,所述方法還包括將判斷為標準化成功的所述采集地址與所述標準地址庫內的地址建立映射關系。
10.一種計算機可讀存儲介質,其上存儲有一或多個計算機程序,其特征在于,該一或多個計算機程序被計算機處理器執行時實施權利要求1至9中任一項所述的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廈門市美亞柏科信息股份有限公司,未經廈門市美亞柏科信息股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910314344.2/1.html,轉載請聲明來源鉆瓜專利網。





