[發(fā)明專利]地址識別方法、裝置、設(shè)備與計(jì)算機(jī)可讀存儲介質(zhì)有效
| 申請?zhí)枺?/td> | 202010522610.3 | 申請日: | 2020-06-10 |
| 公開(公告)號: | CN111680500B | 公開(公告)日: | 2023-07-14 |
| 發(fā)明(設(shè)計(jì))人: | 張慢麗;黃國財(cái);陳政 | 申請(專利權(quán))人: | 深圳前海微眾銀行股份有限公司 |
| 主分類號: | G06F40/279 | 分類號: | G06F40/279;G06F16/332 |
| 代理公司: | 深圳市世紀(jì)恒程知識產(chǎn)權(quán)代理事務(wù)所 44287 | 代理人: | 晏波 |
| 地址: | 518000 廣東省深圳市前海深港合作區(qū)前*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 地址 識別 方法 裝置 設(shè)備 計(jì)算機(jī) 可讀 存儲 介質(zhì) | ||
1.一種地址識別方法,其特征在于,所述地址識別方法包括如下步驟:
若檢測到待識別文本,則基于預(yù)設(shè)規(guī)則,識別所述待識別文本中的非行政區(qū)域信息;
將所述待識別文本中的非行政區(qū)域信息分離出去,以得到地址文本;
若檢測到地址文本,則基于偏移指針,確定所述地址文本對應(yīng)的目標(biāo)詞條,并基于所述目標(biāo)詞條,確定行政區(qū)劃樹中與所述地址文本匹配的目標(biāo)區(qū)域項(xiàng);
基于所述目標(biāo)區(qū)域項(xiàng)的區(qū)域代碼,確定所述目標(biāo)區(qū)域項(xiàng)的區(qū)域級別,并確定所述目標(biāo)區(qū)域項(xiàng)的匹配類型;
確定所述地址文本對應(yīng)的記錄區(qū)中是否已記錄所述區(qū)域級別對應(yīng)的最佳區(qū)域項(xiàng);
若是,則基于所述匹配類型,更新所述區(qū)域級別對應(yīng)的最佳區(qū)域項(xiàng);
若所述區(qū)域級別為省級以下,且所述記錄區(qū)中未記錄全所述目標(biāo)區(qū)域項(xiàng)的上級區(qū)域項(xiàng),則基于目標(biāo)區(qū)域項(xiàng)的上級代碼,在所述行政區(qū)劃樹中向上匹配所述目標(biāo)區(qū)域項(xiàng)的上級區(qū)域項(xiàng);
基于預(yù)設(shè)匹配規(guī)則、所述目標(biāo)區(qū)域項(xiàng)和所述上級區(qū)域項(xiàng),更新記錄所述記錄區(qū)中各區(qū)域級別的最佳區(qū)域項(xiàng);
所述行政區(qū)劃樹以國家為根節(jié)點(diǎn),以各行政區(qū)域?yàn)榉种Ч?jié)點(diǎn),每一節(jié)點(diǎn)的父節(jié)點(diǎn)是對應(yīng)節(jié)點(diǎn)的上一級行政區(qū)域,每一節(jié)點(diǎn)的子節(jié)點(diǎn)是對應(yīng)節(jié)點(diǎn)的下一級行政區(qū)域;
確定所述最佳區(qū)域項(xiàng)的上下級關(guān)系,并基于所述上下級關(guān)系,確定所述最佳區(qū)域項(xiàng)是否正確;
若正確,則基于所述最佳區(qū)域項(xiàng)和所述非行政區(qū)域信息,輸出所述地址文本對應(yīng)的識別結(jié)果。
2.如權(quán)利要求1所述的地址識別方法,其特征在于,所述目標(biāo)詞條至少包括第一目標(biāo)詞條和第二目標(biāo)詞條,所述目標(biāo)區(qū)域項(xiàng)對應(yīng)至少包括第一目標(biāo)區(qū)域項(xiàng)和第二目標(biāo)區(qū)域項(xiàng),所述若檢測到地址文本,則基于所述偏移指針,確定所述地址文本對應(yīng)的目標(biāo)詞條,并基于所述目標(biāo)詞條,確定所述行政區(qū)劃樹中與所述地址文本匹配的目標(biāo)區(qū)域項(xiàng)的步驟包括:
若檢測到地址文本,則基于所述偏移指針,確定所述地址文本對應(yīng)的第一目標(biāo)詞條,并在所述行政區(qū)劃樹中確定與所述第一目標(biāo)詞條匹配的第一目標(biāo)區(qū)域項(xiàng);
基于預(yù)設(shè)文本單位,控制所述偏移指針進(jìn)行偏移,以基于偏移后的所述偏移指針,確定所述地址文本對應(yīng)的第二目標(biāo)詞條,并在第一目標(biāo)區(qū)域項(xiàng)在所述行政區(qū)劃樹對應(yīng)的子節(jié)點(diǎn)中確定與第二目標(biāo)詞條匹配的第二目標(biāo)區(qū)域項(xiàng)。
3.如權(quán)利要求2所述的地址識別方法,其特征在于,所述若檢測到地址文本,則基于所述偏移指針,確定所述地址文本對應(yīng)的第一目標(biāo)詞條的步驟包括:
若檢測到地址文本,則確定所述偏移指針在所述地址文本指向的目標(biāo)文本內(nèi)容為當(dāng)前主鍵,并確定所述行政區(qū)劃樹中是否存在與當(dāng)前主鍵匹配的詞條;
若存在所述詞條,則確定所述詞條是否存在子詞條;
若存在所述子詞條,則控制所述偏移指針往所述地址文本的文本方向偏移預(yù)設(shè)文本單位,并基于所述偏移指針偏移后指向的文本內(nèi)容和所述目標(biāo)文本內(nèi)容,更新當(dāng)前主鍵,并繼續(xù)執(zhí)行所述確定所述行政區(qū)劃樹中是否存在與當(dāng)前主鍵匹配的詞條的步驟;
若不存在所述子詞條,則確定所述詞條是否是行政區(qū)域名字詞條,其中,若是,則確定所述詞條為第一目標(biāo)詞條。
4.如權(quán)利要求3所述的地址識別方法,其特征在于,所述確定所述行政區(qū)劃樹中是否存在與當(dāng)前主鍵匹配的詞條的步驟之后,所述地址識別方法還包括:
若不存在所述詞條,則確定所述偏移指針的跳躍次數(shù)是否未超過預(yù)設(shè)次數(shù);
若是,則控制所述偏移指針往所述地址文本的文本方向跳轉(zhuǎn)預(yù)設(shè)文本單位,并累計(jì)更新所述偏移指針的跳躍次數(shù);
基于所述偏移指針跳轉(zhuǎn)后指向的文本內(nèi)容,更新當(dāng)前主鍵,并執(zhí)行所述確定所述行政區(qū)劃樹中是否存在與當(dāng)前主鍵匹配的詞條的步驟。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于深圳前海微眾銀行股份有限公司,未經(jīng)深圳前海微眾銀行股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010522610.3/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





