[發明專利]地址相似度確定方法、裝置和計算機設備在審
| 申請號: | 202110690657.5 | 申請日: | 2021-06-22 |
| 公開(公告)號: | CN113343688A | 公開(公告)日: | 2021-09-03 |
| 發明(設計)人: | 王濟宣;侯亦楊 | 申請(專利權)人: | 南京星云數字技術有限公司 |
| 主分類號: | G06F40/289 | 分類號: | G06F40/289;G06F40/216 |
| 代理公司: | 北京市萬慧達律師事務所 11111 | 代理人: | 勞奕琴 |
| 地址: | 211800 江蘇省南京市江*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 地址 相似 確定 方法 裝置 計算機 設備 | ||
1.一種地址相似度確定方法,其特征在于,方法包括:
獲取第一原始地址中的第一具體地址信息,第一具體地址信息為由所述第一原始地址中除行政區域信息之外的地址信息構成,以及獲取第二原始地址中的第二具體地址信息,所述第二具體地址信息為由所述第二原始地址中除行政區域信息之外的地址信息構成,其中,所述第一原始地址的行政區域信息和所述第二原始地址的行政區域信息表征同一行政區域;
采用N-Gram模型對所述第一具體地址信息進行分詞,得到第一系列分詞,以及采用N-Gram模型對所述第二具體地址信息進行分詞,得到第二系列分詞;
對所述第一系列分詞和所述第二系列分詞進行相似度計算,獲得第一類相似度值;
根據所述第一類相似度值,確定所述第一原始地址和所述第二原始地址的相似度。
2.根據權利要求1所述的方法,其特征在于,
所述第一具體地址信息包括第一描述字段和第一門牌信息,所述采用N-Gram模型對所述第一具體地址信息進行分詞,得到第一系列分詞,包括:采用所述N-Gram模型對所述第一描述字段進行分詞,得到所述第一系列分詞;
所述第二具體地址信息包括第二描述字段和第二門牌信息,所述采用N-Gram模型對所述第二具體地址信息進行分詞,得到第二系列分詞,包括:采用所述N-Gram模型對所述第二描述字段進行分詞,得到所述第二系列分詞;
所述方法還包括:對所述第一門牌信息和所述第二門牌信息進行相似度計算,獲得第二類相似度值;
所述根據所述第一類相似度值,確定所述第一原始地址和所述第二原始地址的相似度,包括:根據所述第一類相似度值和所述第二類相似度值,確定所述第一原始地址和所述第二原始地址的相似度。
3.根據權利要求2所述的方法,其特征在于,
所述采用所述N-Gram模型對所述第一描述字段進行分詞,得到所述第一系列分詞,包括:確定所述第一描述字段的長度值,根據所述第一描述字段的長度值確定一個以上的第一分詞長度值;根據所述一個以上的第一分詞長度值,采用所述N-Gram模型對所述第一描述字段進行分詞,得到與各第一分詞長度值對應的第一系列分詞;
所述采用所述N-Gram模型對所述第二描述字段進行分詞,得到所述第二系列分詞,包括:確定所述第二描述字段的長度值,根據所述第二描述字段的長度值,確定一個以上的第二分詞長度值;根據所述一個以上的第二分詞長度值,采用所述N-Gram模型對所述第二描述字段進行分詞,得到與各第二分詞長度值對應的第二系列分詞;
所述對所述第一系列分詞和所述第二系列分詞進行相似度計算,獲得第一類相似度值,包括:對分詞長度值相同的所述第一系列分詞和所述第二系列分詞進行相似度計算,獲得所述第一類相似度值。
4.根據權利要求3所述的方法,其特征在于,
所述根據所述第一描述字段的長度值確定一個或多個的第一分詞長度值,包括:根據所述第一描述字段的長度值,確定出多個不大于所述第一描述字段的長度值的第一分詞長度值;
所述根據所述一個以上的第一分詞長度值,采用所述N-Gram模型對所述第一描述字段進行分詞,得到與第一分詞長度值對應的第一系列分詞,包括:將所述各第一分詞長度值分別作為所述N-Gram模型中的N值,對所述第一描述字段進行分詞,得到各第一分詞長度值對應的第一系列分詞;
所述根據所述第二描述字段的長度值確定一個或多個的第二分詞長度值,包括:根據所述第二描述字段的長度值,確定出多個不大于所述第二描述字段的長度值的第二分詞長度值;
所述根據所述一個以上的第二分詞長度值,采用所述N-Gram模型對所述第二描述字段進行分詞,得到與第二分詞長度值對應的第一系列分詞,包括:將各第二分詞長度值作為所述N-Gram模型中的N值,對所述第二描述字段進行分詞,得到各第二分詞長度值對應的第二系列分詞;
所述對分詞長度值相同的所述第一系列分詞和所述第二系列分詞進行相似度計算,獲得所述第一類相似度值,包括:按照分詞長度值從大到小的排序,依次從多個所述第一系列分詞以及多個所述第二系列分詞中選取分詞長度值相同的第一系列分詞和第二系列分詞進行相似度計算,當相似度計算結果滿足預設要求時,根據所述相似度計算結果獲得所述第一類相似度值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京星云數字技術有限公司,未經南京星云數字技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110690657.5/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種建筑工程用的穩定低噪型土坯夯實設備
- 下一篇:一種在線噪聲監測方法及裝置





