[發(fā)明專利]一種基于地點(diǎn)POI的大數(shù)據(jù)解析地址文本的方法有效
| 申請(qǐng)?zhí)枺?/td> | 202011589770.6 | 申請(qǐng)日: | 2020-12-29 |
| 公開(kāi)(公告)號(hào): | CN112732779B | 公開(kāi)(公告)日: | 2022-12-30 |
| 發(fā)明(設(shè)計(jì))人: | 劉超群 | 申請(qǐng)(專利權(quán))人: | 合肥市智享億云信息科技有限公司 |
| 主分類號(hào): | G06F16/2458 | 分類號(hào): | G06F16/2458;G06F16/29;G06F16/34;G06F16/951;G06F40/205 |
| 代理公司: | 暫無(wú)信息 | 代理人: | 暫無(wú)信息 |
| 地址: | 230000 安徽省*** | 國(guó)省代碼: | 安徽;34 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 地點(diǎn) poi 數(shù)據(jù) 解析 地址 文本 方法 | ||
1.一種基于地點(diǎn)POI的大數(shù)據(jù)解析地址文本的方法,其特征在于:包括如下步驟: S1、城市POI基礎(chǔ)數(shù)據(jù)處理; S2、匹配地址文本解析;
S3、數(shù)據(jù)分析及可視化展示;
S1中城市POI基礎(chǔ)數(shù)據(jù)處理具體包括如下步驟:
S11:POI數(shù)據(jù)爬取;
S12:POI名稱優(yōu)化;
S13:POI別名自動(dòng)處理;
S14:POI人工調(diào)優(yōu);
S11中POI數(shù)據(jù)爬取的具體操作為:
a.對(duì)線上地圖,以多次、不同范圍的矩形掃描方式爬取地點(diǎn)POI,同時(shí)可繼續(xù)探索其他數(shù)據(jù)獲取方式,包括其他網(wǎng)站,政府統(tǒng)計(jì)數(shù)據(jù);
b.將爬取的POI數(shù)據(jù)分類存儲(chǔ)到數(shù)據(jù)庫(kù);
S12中POI名稱優(yōu)化的具體操作為:
a.去除明顯無(wú)效及重復(fù)的數(shù)據(jù);
b.POI名有包含關(guān)系,判斷距離,如小于200米則合并且處理;
c.名稱含“XX省”、“XX市”的,優(yōu)化為“省”及“市”;針對(duì)地產(chǎn)類:如有且只有含有“一期”、“一棟”、“A座”,則去除“一期”、“一棟”、“A座”;
d.針對(duì)地產(chǎn)類寫字樓:自動(dòng)合并“A座”、“A棟”并重命名,去掉“B座”、“C座”等;
S13中POI別名自動(dòng)處理的具體操作為:
1)針對(duì)地產(chǎn)類:
a.智能提取“-”及“·”中的前綴,如“XX-#名郡”,提取“XX”并保存到 tag_poi;
b.遇到類似“XX-#名郡”、“XX#名郡”,智能添加備注“#名郡”;
2)針對(duì)政府單位類:
a.XX村村民員會(huì),可簡(jiǎn)稱為XX村委;
b.XX鎮(zhèn)委員會(huì),可簡(jiǎn)稱為XX鎮(zhèn)委、XX市委;
c.XX鎮(zhèn)紀(jì)律檢查委員會(huì),可簡(jiǎn)稱為XX鎮(zhèn)紀(jì)委、XX市紀(jì)委;
d.XX鎮(zhèn)人民政府,可簡(jiǎn)稱為XX鎮(zhèn)政府、XX市政府;
S14中POI管理界面的具體操作為:WEB端給管理員,用于人工補(bǔ)充POI、修正POI別名和備注;
S2中匹配地址文本解析具體包括如下步驟:
S21:處理流程;
S22:地址最終定位處理;
S21中處理流程的具體操作為:
1)數(shù)據(jù)預(yù)處理,拋棄明顯錯(cuò)誤的地址,如空白、只有省市區(qū)道路名的地址等分類單獨(dú)存儲(chǔ);
2)路口、交叉口、路號(hào)全稱匹配,以實(shí)際路口、交叉口、道路名+路號(hào)基礎(chǔ)數(shù)據(jù),統(tǒng)一格式化處理,匹配地址對(duì)應(yīng)的道路信息;
3)道路尾部路號(hào)補(bǔ)齊,處理包含如“長(zhǎng)江西路339”的地址,補(bǔ)齊為“長(zhǎng)江西路339號(hào)”;
4)道路拼音匹配,地址中文拼音匹配道路名+路號(hào);
5)道路智能匹配,地址模糊匹配道路名+路號(hào)、或路口,AI文本相似度匹配,處理錯(cuò)字,多字,少字的模糊匹配;
6)POI全稱別名匹配,其中房產(chǎn)類型優(yōu)先匹配,poi名稱長(zhǎng)度優(yōu)先匹配,特殊符號(hào)別名自動(dòng)處理,獲取地址對(duì)應(yīng)的POI;
7)POI全稱、別名拼音匹配,住宅區(qū)、學(xué)校類型poi,參與拼音匹配;
8)POI智能匹配,AI文本相似度匹配,模糊匹配,參與智能匹配的poi類型為住宅區(qū)、高校、綜合醫(yī)院;
S22中地址最終定位處理的具體操作為:
1)POI全稱匹配地址處理:
地址當(dāng)前匹配的POI,是否與匹配的道路信息對(duì)應(yīng),如果正確對(duì)應(yīng),則以POI定位,若不對(duì)應(yīng),以全稱/補(bǔ)齊匹配的街道信息為準(zhǔn),其中住宅區(qū)類型以POI名稱定位,無(wú)道路信息,以POI定位;
2)POI別名匹配地址處理:
存在全稱匹配道路信息,以道路信息定位,否則,當(dāng)存在多個(gè)別名匹配到的POI,以長(zhǎng)度最大的定位,無(wú)道路信息,以POI定位;
3)POI模糊匹配地址處理:
存在道路全稱匹配以道路信息定位,不存在道路信息,多個(gè)POI名稱最長(zhǎng)定位,道路模糊和POI模糊匹配名稱最長(zhǎng)定位;
4)POI未匹配地址處理:
道路全稱匹配定位,道路模糊匹配定位,最終剩余未處理;
5)POI重名處理:
地址匹配到的POI,存在多個(gè)重名時(shí),需要根據(jù)區(qū)域道路信息確定,若無(wú)法區(qū)分,則丟棄,地址與POI所屬區(qū)域不同,丟棄。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于合肥市智享億云信息科技有限公司,未經(jīng)合肥市智享億云信息科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011589770.6/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- POI數(shù)據(jù)處理方法及其裝置、POI檢索方法及其裝置
- 一種生成POI數(shù)據(jù)的方法及裝置
- 用于把興趣點(diǎn)(POI)添加到POI列表中的導(dǎo)航設(shè)備
- 一種興趣點(diǎn)顯示信息的設(shè)置方法及裝置
- POI數(shù)據(jù)的處理方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 興趣點(diǎn)POI分類方法和裝置
- 一種基于用戶生成內(nèi)容的POI空間影響力評(píng)價(jià)方法及系統(tǒng)
- 一種POI判重方法、裝置、移動(dòng)終端及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- POI檢索熱度確定方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 模型的訓(xùn)練方法、POI標(biāo)簽檢測(cè)方法和裝置
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





