[發明專利]地址數據處理方法、裝置、電子設備及計算機可讀介質有效
| 申請號: | 201911234212.5 | 申請日: | 2019-12-05 |
| 公開(公告)號: | CN110990651B | 公開(公告)日: | 2021-06-04 |
| 發明(設計)人: | 斯義譜;葉露 | 申請(專利權)人: | 同盾控股有限公司 |
| 主分類號: | G06F16/903 | 分類號: | G06F16/903;G06F16/909 |
| 代理公司: | 北京律智知識產權代理有限公司 11438 | 代理人: | 孫寶海;袁禮君 |
| 地址: | 311121 浙江省杭州市余*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 地址 數據處理 方法 裝置 電子設備 計算機 可讀 介質 | ||
本公開的實施例提供了一種地址數據處理方法、裝置、電子設備及計算機可讀介質。該方法包括:獲取目標地址信息;對所述地址文本數據進行處理,獲得目標字符串信息;根據第一數據集和/或第二數據集對所述目標字符串信息進行處理,獲得所述目標地址信息的目標地址類型信息;其中,所述第一數據集包括尾部詞及其尾部地址類型標注,所述第二數據集包括第二地址信息及其第一切分地址、第二切分地址、地址類型標注。本公開實施例提供的地址數據處理方法、裝置、電子設備及計算機可讀介質,通過第一數據集和/或第二數據集對目標地址類型信息進行匹配,無需借助額外硬件設施與軟件技術服務,能夠實現算法高覆蓋率條件下的地址準確分類。
技術領域
本公開涉及地址技術服務領域,具體而言,涉及一種地址數據處理方法、裝置、電子設備及計算機可讀介質。
背景技術
目前,地址核驗產品是在市場上相對需求最高的地址類數據產品。鑒于家庭和工作地址是用戶在日常生活中最活躍的兩個地點,市面上需求較多的兩個地址核驗產品為:工作地址核驗和家庭地址核驗。目前市場上已有的地址核驗產品,大多數采用的數據為基于位置服務(Location Based Services,LBS)數據,通過策略或模型分析人群的作息時間特征,進而對地址位置進行標注,判斷其為家庭地址、工作或其他地址。例如,通過地址編碼(將詳細的結構化地址轉換為經緯度坐標),可以將地址轉化為經緯度坐標,結合LBS獲取到人群的經緯度坐標數據,若某個坐標點上或區域內白天活躍人群數量顯著高于晚上的或者周一至周五活躍人群數量顯著高于周末的,則該地址很可能是一個工作地址,反之,若其晚上活躍人群數量顯著高于白天或周末人群活躍人群數量顯著高于周一至周五,則其很可能是一個家庭地址,否則不能判別其具體類型。
然而,上述方法存在下述缺陷:
(1)對數據量依賴過大:該分類方法是建立在大量數據基礎之上的,而目前LBS數據精度高低不一,且覆蓋率極低,只有10-15%,底層數據的不足導致上層分類模型的覆蓋率和準確率不高。(2)模型特征閾值難以確定:該分類方法需構建許多人群行為特征,雖然人群的行為是有規律可循,但規律界限很難確定。例如什么情況下才是“白天活躍人群數量顯著高于晚上”,高出多少才是顯著高。另外,該方法無法判定或無法正確判定上夜班、或24小時倒班的情況。(3)模型維護成本高,結果可解釋性弱。
因此,需要一種新的地址數據處理方法、裝置、電子設備及計算機可讀介質。
需要說明的是,在上述背景技術部分公開的信息僅用于加強對本公開的背景的理解,因此可以包括不構成對本領域普通技術人員已知的現有技術的信息。
發明內容
本公開實施例提供一種地址數據處理方法、裝置及電子設備,進而至少在一定程度上克服現有技術中地址分類覆蓋率低且正確性低的缺陷。
本公開的其他特性和優點將通過下面的詳細描述變得顯然,或部分地通過本公開的實踐而習得。
本公開實施例提出一種地址數據處理方法,包括:獲取目標地址信息;對所述地址文本數據進行處理,獲得目標字符串信息;根據第一數據集和/或第二數據集對所述目標字符串信息進行處理,獲得所述目標地址信息的目標地址類型信息;其中,所述第一數據集包括尾部詞及其尾部地址類型標注,所述第二數據集包括第二地址信息及其第一切分地址、第二切分地址、地址類型標注。
在本公開的一種示例性實施例中,根據第一數據集和/或第二數據集對所述目標字符串信息進行處理,獲得所述目標地址信息的目標地址類型信息,包括:將所述目標字符串信息與所述第一數據集中的各尾部詞進行匹配,并將匹配成功的尾部詞的尾部地址類型標注作為所述目標地址類型信息;和/或根據所述目標字符串信息與所述第二數據集中的各第二地址信息的相似度確定所述目標地址類型信息。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于同盾控股有限公司,未經同盾控股有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911234212.5/2.html,轉載請聲明來源鉆瓜專利網。





