[發明專利]基于重復度權重的地址匹配方法及裝置在審
| 申請號: | 202211353271.6 | 申請日: | 2022-11-01 |
| 公開(公告)號: | CN115905464A | 公開(公告)日: | 2023-04-04 |
| 發明(設計)人: | 陸啟衡;侯方杰;陶闖 | 申請(專利權)人: | 上海維智卓新信息科技有限公司 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F40/30;G06Q50/30 |
| 代理公司: | 廣州三環專利商標代理有限公司 44202 | 代理人: | 江銀會 |
| 地址: | 200131 上海市浦東新區*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 重復 權重 地址 匹配 方法 裝置 | ||
本發明公開了一種基于重復度權重的地址匹配方法及裝置,該方法包括:對待匹配地址進行向量化處理,得到對應的地址向量;將所述地址向量與預設的地址數據庫中多個候選地址對應的候選地址向量進行相似度計算,得到所述待匹配地址與任一所述候選地址之間的權重向量相似度;所述權重向量相似度包括所述地址向量與所述候選地址向量之間的相似度與重復度權重的乘積;所述重復度權重與對應的所述地址向量或所述候選地址向量的同一數據外觀可能同時指向的不同實體對象的對象數量成反比;根據所述權重向量相似度,從所述多個候選地址中篩選出所述待匹配地址對應的目標地址。可見,本發明能夠有效提高地址匹配的精確度和效率。
技術領域
本發明涉及數據處理技術領域,尤其涉及一種基于重復度權重的地址匹配方法及裝置。
背景技術
隨著數據處理算法技術和處理設備性能的發展,越來越多的交通或運輸類企業開始采用數據處理技術來實現地址數據的處理,其中,地址匹配技術是重要的一環,對于模糊地址或錯誤地址的準確匹配,可以有效提高企業運行的效率和收益。但現有的地址匹配技術,一般僅考慮到對地址字符的表征數據進行相似度計算,沒有考慮到不同地址對應的重復度對于相似度的影響,因此其匹配精確度較低。可見,現有的基于重復度權重的地址匹配方法存在缺陷,亟待解決。
發明內容
本發明所要解決的技術問題在于,提供一種基于重復度權重的地址匹配方法及裝置,能夠有效提高地址匹配的精確度和效率。
為了解決上述技術問題,本發明第一方面公開了一種基于重復度權重的地址匹配方法,所述方法包括:
對待匹配地址進行向量化處理,得到對應的地址向量;
將所述地址向量與預設的地址數據庫中多個候選地址對應的候選地址向量進行相似度計算,得到所述待匹配地址與任一所述候選地址之間的權重向量相似度;所述權重向量相似度包括所述地址向量與所述候選地址向量之間的相似度與重復度權重的乘積;所述重復度權重與對應的所述地址向量或所述候選地址向量的同一數據外觀可能同時指向的不同實體對象的對象數量成反比;
根據所述權重向量相似度,從所述多個候選地址中篩選出所述待匹配地址對應的目標地址。
作為一個可選的實施方式,在本發明第一方面中,所述重復度權重包括層級重復度權重和/或場景重復度權重;所述層級重復度權重與所述地址向量或所述候選地址向量中的部分或全部向量所屬的地址層級的同一數據外觀可能同時指向的不同實體對象的對象數量成反比;所述場景重復度權重與所述待匹配地址或所述候選地址中的部分或全部地址所屬的場景類型的同一數據外觀可能同時指向的不同實體對象的對象數量成反比;所述數據外觀包括數據名稱、數據向量、數據標識和數據可視化圖案中的至少一種。
作為一個可選的實施方式,在本發明第一方面中,所述地址向量包括所述待匹配地址對應的多個地址層級對應的多個地址片段向量;所述候選地址向量包括所述候選地址對應的多個地址層級對應的多個候選地址片段向量;
以及,所述對待匹配地址進行向量化處理,得到對應的地址向量,包括:
對待匹配地址進行拆分,以得到多個地址層級對應的待匹配地址片段;
對所述待匹配地址片段進行向量化處理,得到對應的地址片段向量。
作為一個可選的實施方式,在本發明第一方面中,所述將所述地址向量與預設的地址數據庫中多個候選地址對應的候選地址向量進行相似度計算,得到所述待匹配地址與任一所述候選地址之間的權重向量相似度,包括:
對于預設的地址數據庫中多個候選地址中的任一所述候選地址,獲取該候選地址對應的多個地址層級的候選地址片段的候選地址片段向量;
計算所述待匹配地址對應的任一所述地址片段向量與同一所述地址層級的所述候選地址片段向量之間的加權向量相似度;所述加權相似度為所述地址片段向量與同一層級的所述候選地址片段向量之間的相似度與所述重復度權重的乘積
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海維智卓新信息科技有限公司,未經上海維智卓新信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211353271.6/2.html,轉載請聲明來源鉆瓜專利網。





