[發明專利]地址匹配方法、裝置及計算機可讀存儲介質有效
| 申請號: | 202110834270.2 | 申請日: | 2021-07-22 |
| 公開(公告)號: | CN113515677B | 公開(公告)日: | 2023-10-27 |
| 發明(設計)人: | 張強;高恩偉;閆巖 | 申請(專利權)人: | 中移(杭州)信息技術有限公司;中國移動通信集團有限公司 |
| 主分類號: | G06F16/903 | 分類號: | G06F16/903;G06N3/0464;G06N3/08 |
| 代理公司: | 深圳市世紀恒程知識產權代理事務所 44287 | 代理人: | 薛福玲 |
| 地址: | 311100 浙江省杭州市余*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 地址 匹配 方法 裝置 計算機 可讀 存儲 介質 | ||
本發明公開了一種地址匹配方法、裝置及計算機可讀存儲介質,所述地址匹配方法包括:獲取標準地址集合中與待匹配地址匹配的至少兩個目標地址,所述標準地址集合中包括至少兩個數據源的地址,各個所述目標地址分別根據不同匹配模型匹配得到;確定各個所述目標地址的置信度,所述目標地址匹配的數據源的數量越多,對應的置信度越高;根據各個所述目標地址的置信度,在所有所述目標地址中確定與所述待匹配地址匹配的所述目標地址。本發明能夠提升地址匹配的準確性。
技術領域
本發明涉及數據處理技術領域,尤其涉及一種地址匹配方法、裝置及計算機可讀存儲介質。
背景技術
在通信領域,有地址匹配需求,比如,移動基站小區地址、居民住宅小區地址、學校、醫院機構地址等地址信息在被人工采集后,由于可能存在不準確的問題,需要將采集的地址與標準地址進行匹配,以得到對應的正確標準地址,比如待匹配小區為“籃天嘉園”,根據最小編輯距離計算相似度得到的結果是“籃球嘉園”,而正確的結果應該是“藍天家園”,因此簡單的使用最小編輯距離計算相似度進行地址匹配時,匹配正確率較低,本發明至少解決下述技術問題:如何提升地址匹配的準確性。
發明內容
本發明的主要目的在于提供一種地址匹配方法、裝置及計算機可讀存儲介質,旨在解決地址匹配的準確性低的技術問題。
為實現上述目的,本發明提供一種地址匹配方法,所述地址匹配方法包括:
獲取標準地址集合中與待匹配地址匹配的至少兩個目標地址,所述標準地址集合中包括至少兩個數據源的地址,各個所述目標地址分別根據不同匹配模型匹配得到;
確定各個所述目標地址的置信度,所述目標地址匹配的數據源的數量越多,對應的置信度越高;
根據各個所述目標地址的置信度,在所有所述目標地址中確定與所述待匹配地址匹配的所述目標地址。
可選地,所述獲取標準地址集合中與待匹配地址匹配的至少兩個目標地址的步驟包括:
根據所述待匹配地址、所述標準地址集合以及預設概率轉移矩陣模型確定第一目標地址,所述預設概率轉移矩陣模型根據地址訓練集以及所述標準地址集合對概率轉移矩陣訓練模型訓練得到;
根據所述待匹配地址、所述標準地址集合以及預設殘差網絡融合模型確定第二目標地址,所述預設殘差網絡融合模型包括嵌入層、TextRCNN網絡、TextCNN網絡、殘差層以及預設激活函數,所述預設殘網絡融合模型根據所述地址訓練集以及所述標準地址集合對殘差網絡融合訓練模型訓練得到,所述目標地址分別為所述第一目標地址以及所述第二目標地址。
可選地,所述根據所述待匹配地址、所述標準地址集合以及預設概率轉移矩陣模型確定所述第一地址的步驟包括:
獲取所述標準地址集合中出現頻次大于預設頻次的候選特征字;
根據所述候選特征字構建特征字集合;
根據所述特征字集合提取所述待匹配地址對應的特征字序列,所述特征字序列包括所述候選特征字以及所述待匹配地址中的普通字符;
根據目標組合長度以及預設組合順序,對所述特征字序列中的特征字元素進行組合,得到所述目標組合長度的特征字子串集合;
根據預設隱馬爾可夫模型以及所述目標組合長度的特征字子串集合,確定所述特征字子串集合對應的聯合概率,所述預設隱馬爾可夫模型根據所述標準地址集合對隱馬爾可夫訓練模型訓練得到,所述特征字子串集合對應的聯合概率根據所述隱馬爾科夫模型中的特征字轉移概率得到,所述預設轉移概率模型為所述預設隱馬爾可夫模型;
在所述目標組合長度小于預設組合長度時,增大所述目標組合長度,并返回執行所述根據目標組合長度以及預設組合順序,對所述特征字序列中的特征字元素進行組合,得到所述目標組合長度的特征字子串集合的步驟;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中移(杭州)信息技術有限公司;中國移動通信集團有限公司,未經中移(杭州)信息技術有限公司;中國移動通信集團有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110834270.2/2.html,轉載請聲明來源鉆瓜專利網。





