[發明專利]一種中文地址識別方法及設備有效
| 申請號: | 201910502405.8 | 申請日: | 2019-06-11 |
| 公開(公告)號: | CN110275940B | 公開(公告)日: | 2022-04-15 |
| 發明(設計)人: | 詹青 | 申請(專利權)人: | 北京貝殼時代網絡科技有限公司 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F40/205;G06F40/289;G06K9/62 |
| 代理公司: | 北京路浩知識產權代理有限公司 11002 | 代理人: | 王慶龍;苗曉靜 |
| 地址: | 100016 北京市朝陽區酒仙*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 中文 地址 識別 方法 設備 | ||
1.一種中文地址識別方法,其特征在于,包括:
獲取有序詞項序列和與所述有序詞項序列對應的地址模型;其中,所述有序詞項序列包括按預設順序排列的復數個詞項,所述地址模型包括由低到高排列的預設總層級數的地址要素層,以及每個地址要素層的識別函數;
根據預設的拼接規則,從所述有序詞項序列中提取出位于開始的至少一個詞項,拼接得到待識別詞;并根據所述地址模型,得到所述地址模型的識別狀態,所述識別狀態用于顯示所述地址模型中匹配成功的地址要素層中的最高層級;
根據所述層級由低到高,依次調用所述層級高于所述識別狀態顯示的層級的地址要素層的識別函數,分別與所述待識別詞進行匹配;
若任一識別函數匹配成功,則將與所述識別函數對應的地址要素層標記為匹配成功,并將匹配得到的已識別地址要素記錄到所述地址要素層中;
根據當前的地址模型,更新所述識別狀態,清空所述待識別詞,并根據當前的有序詞項序列得到新的待識別詞,再根據當前的識別狀態對新的待識別詞進行匹配,直到所述有序詞項序列為空,或者直到最高層級的地址要素層匹配成功,則判定本次匹配成功結束;
通過本次匹配成功結束后的地址模型,將記錄在所有匹配成功的地址要素層中的已識別地址要素進行拼接就可以得到對待識別文本識別后的中文地址。
2.根據權利要求1所述的中文地址識別方法,其特征在于,所述方法還包括:
若所有的識別函數均匹配失敗,則將所述待識別詞命名為未識別詞;
根據所述拼接規則,從所述有序詞項序列中提取出位于開始的至少一個詞項,拼接到所述未識別詞后得到新的待識別詞,再根據當前的識別狀態對新的待識別詞進行匹配;相應地,所述方法還包括:
在將所述待識別詞命名為未識別詞后,若此時,所述有序詞項序列為空,則判定本次匹配失敗結束。
3.根據權利要求2所述的中文地址識別方法,其特征在于,所述地址模型將所有的地址要素層分為預設第一層級數的行政地址要素層和預設第二層級數的詳細地址要素層;其中,所述總層級數等于所述第一層級數與第二層級數的和,所述行政地址要素層的層級低于所述詳細地址要素層的層級;相應地,所述根據所述層級由低到高,依次調用所述層級高于所述識別狀態的地址要素層的識別函數,分別與所述待識別詞進行匹配,具體為:
若所述識別狀態顯示為初始狀態,或顯示的層級為行政地址要素層,則根據所述層級由低到高,依次調用所述層級高于所述識別狀態顯示的層級的行政地址要素層的識別函數,分別與所述待識別詞進行匹配:
若所有的識別函數均匹配失敗,則將所述識別狀態設為行政區劃匹配結束,再根據當前的識別狀態對當前的待識別詞進行匹配;相應地,所述根據當前的地址模型,更新所述識別狀態,具體為:
根據當前的地址模型中已經匹配成功的地址要素層中的最高層級,更新所述識別狀態,若所述識別狀態為最高層級的行政地址要素層,則將所述識別狀態設為所述行政區劃匹配結束;相應地,所述方法還包括:
若所述識別狀態顯示為行政區劃匹配結束,則根據所述層級由低到高,依次調用所有的詳細地址要素層的識別函數,分別與所述待識別詞進行匹配。
4.根據權利要求3所述的中文地址識別方法,其特征在于,所述根據所述層級由低到高,依次調用所述層級高于所述識別狀態的地址要素層的識別函數,分別與所述待識別詞進行匹配,具體為:
若所述識別狀態顯示為所述初始狀態,則根據所述層級由低到高,依次調用預設層級閾值的行政地址要素層的識別函數,分別與所述待識別詞進行匹配;其中,所述層級閾值小于等于所有行政地址要素層的層級數量:
若所有的識別函數均匹配失敗,則判定本次匹配失敗結束。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京貝殼時代網絡科技有限公司,未經北京貝殼時代網絡科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910502405.8/1.html,轉載請聲明來源鉆瓜專利網。





