[發(fā)明專利]地址數(shù)據(jù)的匹配方法、裝置、計算機設(shè)備及存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 202011195424.X | 申請日: | 2020-10-30 |
| 公開(公告)號: | CN112307169A | 公開(公告)日: | 2021-02-02 |
| 發(fā)明(設(shè)計)人: | 徐耀宗;羅冬陽;魏晨晨 | 申請(專利權(quán))人: | 中國平安財產(chǎn)保險股份有限公司 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/31 |
| 代理公司: | 深圳眾鼎專利商標代理事務(wù)所(普通合伙) 44325 | 代理人: | 譚果林 |
| 地址: | 518000 廣東省深圳市*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 地址 數(shù)據(jù) 匹配 方法 裝置 計算機 設(shè)備 存儲 介質(zhì) | ||
1.一種地址數(shù)據(jù)的匹配方法,其特征在于,包括:
獲取用戶登記的用戶地址數(shù)據(jù);
通過單詞查找樹解析出所述用戶地址數(shù)據(jù)的待比對關(guān)鍵區(qū)域信息,同時根據(jù)所述待比對關(guān)鍵區(qū)域信息從所述用戶地址數(shù)據(jù)分割出待比對模糊區(qū)域信息;
根據(jù)預(yù)設(shè)的倒排索引檢索結(jié)構(gòu)對所述待比對模糊區(qū)域信息進行倒排索引檢索,獲取與所述用戶地址數(shù)據(jù)之間的匹配值滿足預(yù)設(shè)匹配條件的預(yù)設(shè)數(shù)量的預(yù)設(shè)候選標準地址;每一個所述預(yù)設(shè)標準地址均包括預(yù)設(shè)模糊區(qū)域信息和預(yù)設(shè)關(guān)鍵區(qū)域信息,所述倒排索引檢索結(jié)構(gòu)是根據(jù)多個所述預(yù)設(shè)候選標準地址的預(yù)設(shè)模糊區(qū)域信息所構(gòu)建;
將所述用戶地址數(shù)據(jù)的待比對關(guān)鍵區(qū)域信息與獲取的預(yù)設(shè)數(shù)量的所述預(yù)設(shè)候選標準地址的預(yù)設(shè)關(guān)鍵區(qū)域信息進行對比矯正,獲取矯正結(jié)果;
在所述矯正結(jié)果為矯正成功時,根據(jù)矯正成功的所述矯正結(jié)果確定出與所述用戶地址數(shù)據(jù)匹配的標準匹配地址,并將所述標準匹配地址代替所述用戶登記的用戶地址數(shù)據(jù)。
2.根據(jù)權(quán)利要求1所述的地址數(shù)據(jù)的匹配方法,其特征在于,所述通過單詞查找樹解析出所述用戶地址數(shù)據(jù)的待比對關(guān)鍵區(qū)域信息之前,還包括:
預(yù)先建造一個初始節(jié)點,按照預(yù)設(shè)前綴特性將所有關(guān)鍵區(qū)域信息劃分為多個子節(jié)點,并根據(jù)所述關(guān)鍵區(qū)域信息所對應(yīng)的串集合將所述子節(jié)點組裝至所述初始節(jié)點中。
3.根據(jù)權(quán)利要求1所述的地址數(shù)據(jù)的匹配方法,其特征在于,所述根據(jù)預(yù)設(shè)的倒排索引檢索結(jié)構(gòu)對所述待比對模糊區(qū)域信息進行倒排索引檢索之前,還包括:
獲取多個所述預(yù)設(shè)候選標準地址,并通過預(yù)設(shè)劃分規(guī)則從所述預(yù)設(shè)標準地址中分割出預(yù)設(shè)模糊區(qū)域信息和預(yù)設(shè)關(guān)鍵區(qū)域信息;
將一個所述預(yù)設(shè)模糊區(qū)域信息作為一個比對文檔,對所述比對文檔進行分詞,得到多個詞條,并生成與每一個所述比對文檔對應(yīng)的文檔ID;
將所述比對文檔中分詞得到的所述詞條作為與其對應(yīng)的文檔ID關(guān)聯(lián)的關(guān)鍵字索引,根據(jù)所述關(guān)鍵詞索引構(gòu)建所述倒排索引結(jié)構(gòu)。
4.根據(jù)權(quán)利要求1所述的地址數(shù)據(jù)的匹配方法,其特征在于,所述根據(jù)預(yù)設(shè)的倒排索引檢索結(jié)構(gòu)對所述待比對模糊區(qū)域信息進行倒排索引檢索,獲取與所述用戶地址數(shù)據(jù)之間的匹配值滿足預(yù)設(shè)匹配條件的預(yù)設(shè)數(shù)量的預(yù)設(shè)候選標準地址,包括:
從所述待比對模糊區(qū)域信息劃分出多個檢索字,根據(jù)所述倒排索引檢索結(jié)構(gòu)檢索出與所述檢索字對應(yīng)的索引關(guān)鍵字,并獲取所述索引關(guān)鍵字所關(guān)聯(lián)的所有文檔ID;一個所述檢索字對應(yīng)一個所述索引關(guān)鍵字;
對與各所述檢索字對應(yīng)的所有文檔ID進行匯總,得到匯總文檔ID,將與各所述檢索字對應(yīng)的所有文檔ID在所述匯總文檔ID中所出現(xiàn)的次數(shù)記錄為該檢索字的目標次數(shù),根據(jù)所述目標次數(shù)確定各所述文檔ID與所述用戶地址數(shù)據(jù)之間的匹配值,并對匹配值進行排序;
將排序之后匹配值序列在先的預(yù)設(shè)數(shù)量的所述文檔ID對應(yīng)的比對文檔均記錄為目標文檔,并將所述倒排索引檢索結(jié)構(gòu)中所述目標文檔所屬的預(yù)設(shè)候選標準地址記錄為與所述用戶地理數(shù)匹配的預(yù)設(shè)候選標準地址。
5.根據(jù)權(quán)利要求1所述的地址數(shù)據(jù)的匹配方法,其特征在于,所述將所述用戶地址數(shù)據(jù)的待比對關(guān)鍵區(qū)域信息與獲取的預(yù)設(shè)數(shù)量的所述預(yù)設(shè)候選標準地址的預(yù)設(shè)關(guān)鍵區(qū)域信息進行對比矯正,獲取矯正結(jié)果之后,還包括:
在所述矯正結(jié)果為矯正失敗時,將矯正失敗的矯正結(jié)果所對應(yīng)的預(yù)設(shè)關(guān)鍵區(qū)域信息進行剔除。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國平安財產(chǎn)保險股份有限公司,未經(jīng)中國平安財產(chǎn)保險股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011195424.X/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種馬桶自動裝箱裝置
- 下一篇:一種有色金屬等溫熔爐
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





