[發(fā)明專利]一種基于地點(diǎn)POI的大數(shù)據(jù)解析地址文本的方法有效
| 申請(qǐng)?zhí)枺?/td> | 202011589770.6 | 申請(qǐng)日: | 2020-12-29 |
| 公開(kāi)(公告)號(hào): | CN112732779B | 公開(kāi)(公告)日: | 2022-12-30 |
| 發(fā)明(設(shè)計(jì))人: | 劉超群 | 申請(qǐng)(專利權(quán))人: | 合肥市智享億云信息科技有限公司 |
| 主分類號(hào): | G06F16/2458 | 分類號(hào): | G06F16/2458;G06F16/29;G06F16/34;G06F16/951;G06F40/205 |
| 代理公司: | 暫無(wú)信息 | 代理人: | 暫無(wú)信息 |
| 地址: | 230000 安徽省*** | 國(guó)省代碼: | 安徽;34 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 地點(diǎn) poi 數(shù)據(jù) 解析 地址 文本 方法 | ||
本發(fā)明涉及地址文本解析技術(shù)領(lǐng)域,具體為一種基于地點(diǎn)POI的大數(shù)據(jù)解析地址文本的方法,包括如下步驟:S1、城市POI基礎(chǔ)數(shù)據(jù)處理;S2、匹配地址文本解析;S3、數(shù)據(jù)分析及可視化展示。本發(fā)明通過(guò)城市POI基礎(chǔ)數(shù)據(jù)處理加匹配地址文本解析的方法,可實(shí)現(xiàn)對(duì)用戶包裹地址的統(tǒng)計(jì)和分析,并可以精確定位地址文本,實(shí)現(xiàn)對(duì)用戶包裹地址的精確分析統(tǒng)計(jì),為郵政、物流公司或者電商企業(yè)等提供了有效的用戶分布數(shù)據(jù)及畫像,進(jìn)而可為快遞攬投部選址及人員配備提供決策依據(jù)。
技術(shù)領(lǐng)域
本發(fā)明涉及地址文本解析技術(shù)領(lǐng)域,具體為一種基于地點(diǎn)POI的大數(shù)據(jù)解析地址文本的方法。
背景技術(shù)
對(duì)于某些用戶量龐大的郵政、物流公司或者電商企業(yè)等,存在大量的用戶包裹地址,往往需要根據(jù)這些地址文本,統(tǒng)計(jì)和分析用戶的分布情況。其中的難點(diǎn)就是如何精確定位這些地址文本。由于這些地址可能來(lái)自于第三方電商平臺(tái)或由于用戶輸入錯(cuò)誤,導(dǎo)致文本數(shù)據(jù)難以解析,這些地址文本的特點(diǎn)是:沒(méi)有固定的格式,包含了隨機(jī)的錯(cuò)字,地點(diǎn)的別名,甚至是不存在的地點(diǎn)。對(duì)這些地址直接使用第三方地圖公司接口解析定位,會(huì)造成大量的偏差,無(wú)法達(dá)到統(tǒng)計(jì)分析的目的,使用其他常規(guī)的方法均難以準(zhǔn)確分析處理。鑒于此,我們提出一種基于地點(diǎn)POI的大數(shù)據(jù)解析地址文本的方法。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種基于地點(diǎn)POI的大數(shù)據(jù)解析地址文本的方法,以解決上述背景技術(shù)中提出的問(wèn)題。
為實(shí)現(xiàn)上述目的,本發(fā)明提供如下技術(shù)方案:
一種基于地點(diǎn)POI的大數(shù)據(jù)解析地址文本的方法,包括如下步驟:
S1、城市POI基礎(chǔ)數(shù)據(jù)處理;
S2、匹配地址文本解析;
S3、數(shù)據(jù)分析及可視化展示。
作為本發(fā)明優(yōu)選的技術(shù)方案,S1中城市POI基礎(chǔ)數(shù)據(jù)處理具體包括如下步驟:
S11:POI數(shù)據(jù)爬取;
S12:POI名稱優(yōu)化;
S13:POI別名自動(dòng)處理;
S14:POI人工調(diào)優(yōu)。
作為本發(fā)明優(yōu)選的技術(shù)方案,S11中POI數(shù)據(jù)爬取的具體操作為:
a.對(duì)百度,高德地圖,以多次、不同范圍的矩形掃描方式爬取地點(diǎn)POI,同時(shí)可繼續(xù)探索其他數(shù)據(jù)獲取方式,包括其他網(wǎng)站,政府統(tǒng)計(jì)數(shù)據(jù);
b.將爬取的POI數(shù)據(jù)分類存儲(chǔ)到數(shù)據(jù)庫(kù)。
作為本發(fā)明優(yōu)選的技術(shù)方案,S12中POI名稱優(yōu)化的具體操作為:
a.去除明顯無(wú)效及重復(fù)的數(shù)據(jù);
b.POI名有包含關(guān)系,判斷距離,如小于200米則合并且處理;
c.名稱含“安徽省”、“合肥市”的,優(yōu)化為“省”及“市”;針對(duì)地產(chǎn)類:如有且只有含有“一期”、“一棟”、“A座”,則去除“一期”、“一棟”、“A座”;
d.針對(duì)地產(chǎn)類寫字樓:自動(dòng)合并“A座”、“A棟”并重命名,去掉“B座”、“C座”等。
作為本發(fā)明優(yōu)選的技術(shù)方案,S13中POI別名自動(dòng)處理的具體操作為:
1)針對(duì)地產(chǎn)類:
a.智能提取“-”及“·”中的前綴,如“萬(wàn)科-金色名郡”,提取“萬(wàn)科”并保存到tag_poi;
b.遇到類似“萬(wàn)科-金色名郡”、“萬(wàn)科金色名郡”,智能添加備注“金色名郡”;
2)針對(duì)政府單位類:
a.XX村村民員會(huì),可簡(jiǎn)稱為XX村委;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于合肥市智享億云信息科技有限公司,未經(jīng)合肥市智享億云信息科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011589770.6/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- POI數(shù)據(jù)處理方法及其裝置、POI檢索方法及其裝置
- 一種生成POI數(shù)據(jù)的方法及裝置
- 用于把興趣點(diǎn)(POI)添加到POI列表中的導(dǎo)航設(shè)備
- 一種興趣點(diǎn)顯示信息的設(shè)置方法及裝置
- POI數(shù)據(jù)的處理方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 興趣點(diǎn)POI分類方法和裝置
- 一種基于用戶生成內(nèi)容的POI空間影響力評(píng)價(jià)方法及系統(tǒng)
- 一種POI判重方法、裝置、移動(dòng)終端及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- POI檢索熱度確定方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 模型的訓(xùn)練方法、POI標(biāo)簽檢測(cè)方法和裝置
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





