[發(fā)明專(zhuān)利]一種地址相似度評(píng)估方法有效
| 申請(qǐng)?zhí)枺?/td> | 201711254896.6 | 申請(qǐng)日: | 2017-12-04 |
| 公開(kāi)(公告)號(hào): | CN108171529B | 公開(kāi)(公告)日: | 2021-09-14 |
| 發(fā)明(設(shè)計(jì))人: | 龍華;祁俊輝;邵玉斌;杜慶治 | 申請(qǐng)(專(zhuān)利權(quán))人: | 昆明理工大學(xué) |
| 主分類(lèi)號(hào): | G06Q30/02 | 分類(lèi)號(hào): | G06Q30/02;G06F40/279;G06F40/289 |
| 代理公司: | 暫無(wú)信息 | 代理人: | 暫無(wú)信息 |
| 地址: | 650093 云*** | 國(guó)省代碼: | 云南;53 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 地址 相似 評(píng)估 方法 | ||
本發(fā)明涉及一種地址相似度評(píng)估方法,屬于信息處理技術(shù)領(lǐng)域。本發(fā)明摒棄單純利用地址文本信息或經(jīng)緯度信息確定地址的相似度,而是創(chuàng)新性地將地址文本信息按照行政區(qū)域劃分為六段式詞集合,并對(duì)詞集合以六段式賦予權(quán)重,進(jìn)而通過(guò)Jaro?Winler Distance算法計(jì)算其基于文本信息的相似度、通過(guò)坐標(biāo)轉(zhuǎn)換及勾股定理計(jì)算其基于經(jīng)緯度的相似度、通過(guò)余弦定理計(jì)算其基于詞集合的相似度,三個(gè)相似度分別從不同方面反映了地址的相似程度,最后再將所計(jì)算的三個(gè)相似度進(jìn)行融合,得到最終相似度。本發(fā)明與現(xiàn)有技術(shù)相比,主要解決了現(xiàn)有技術(shù)一味追求效率而導(dǎo)致的準(zhǔn)確性不足等現(xiàn)象,致力于增加目前依靠計(jì)算機(jī)進(jìn)行地址相似度評(píng)估的準(zhǔn)確性。
技術(shù)領(lǐng)域
本發(fā)明涉及一種地址相似度評(píng)估方法,屬于信息處理技術(shù)領(lǐng)域。
背景技術(shù)
地理信息系統(tǒng)在目前業(yè)務(wù)系統(tǒng)中逐漸頻繁使用。例如一些團(tuán)購(gòu)APP會(huì)根據(jù)用戶所處位置查找周邊商家信息;亦或在開(kāi)發(fā)者制作新地圖時(shí)需參考現(xiàn)有地圖進(jìn)行具體地址的比較等。
目前,對(duì)地址進(jìn)行相似度的評(píng)估方法主要分為兩類(lèi):一類(lèi)是將地址文本信息作為輸入,利用字符串相似算法,如Levenshteit Distance,對(duì)地址文本進(jìn)行相似度量;另一類(lèi)是進(jìn)行經(jīng)緯度信息的比較進(jìn)而得出其相似度。但是這兩類(lèi)方法都有各自的缺陷,若直接利用字符串相似算法比較地址文本,一旦地址文本中存在簡(jiǎn)寫(xiě)形式,這種方法誤差較大;若單純依靠經(jīng)緯度信息來(lái)確定,也是一個(gè)非常不可靠的方法,一旦對(duì)多個(gè)現(xiàn)有地圖具體地址進(jìn)行比較時(shí),因?yàn)槊總€(gè)地圖具有自己特有的坐標(biāo)系,多次轉(zhuǎn)換會(huì)使精度不準(zhǔn)確而導(dǎo)致評(píng)估結(jié)果誤差較大。
發(fā)明內(nèi)容
本發(fā)明要解決的技術(shù)問(wèn)題是針對(duì)現(xiàn)有技術(shù)的局限和不足,提供一種地址相似度評(píng)估方法,用以解決上訴問(wèn)題。
本發(fā)明的技術(shù)方案是:一種地址相似度評(píng)估方法,摒棄單純利用地址文本信息或經(jīng)緯度信息確定地址的相似度,而是創(chuàng)新性地將地址文本信息按照行政區(qū)域劃分為六段式詞集合,并對(duì)詞集合以六段式賦予權(quán)重,進(jìn)而計(jì)算其基于文本信息的相似度、基于經(jīng)緯度的相似度、基于詞集合的相似度,最后再將所計(jì)算的三個(gè)相似度融合,得到最終相似度。
具體包括以下步驟:
Step1:獲取待比較地址X的地址文本strx及該地址對(duì)應(yīng)的經(jīng)緯度坐標(biāo)(Ex,Nx),和目標(biāo)地址Y的地址文本stry及該地址對(duì)應(yīng)的經(jīng)緯度坐標(biāo)(Ey,Ny)。
Step2:對(duì)待比較地址X的地址文本strx和目標(biāo)地址Y的地址文本stry進(jìn)行預(yù)處理,采用命名實(shí)體識(shí)別技術(shù)和地址詞庫(kù)對(duì)其進(jìn)行六段式分詞,對(duì)不足六段式的地址進(jìn)行補(bǔ)充,得到待比較地址X的地址詞集合X:{x1,x2…x6}和目標(biāo)地址Y的地址詞集合Y:{y1,y2…y6}。
Step3:對(duì)待比較地址X的地址詞集合X:{x1,x2…x6}和目標(biāo)地址Y的地址詞集合Y:{y1,y2…y6}以六段式設(shè)權(quán)重,對(duì)應(yīng)權(quán)重集合為W:{w1,w2…w6}。
Step4:以待比較地址X的地址文本strx和目標(biāo)地址Y的地址文本stry作為輸入,采用字符串相似算法Jaro-Winler Distance對(duì)其進(jìn)行相似度的計(jì)算,得到待比較地址X和目標(biāo)地址Y之間基于地址文本的相似度Sim1(X,Y)。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于昆明理工大學(xué),未經(jīng)昆明理工大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711254896.6/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G06Q 專(zhuān)門(mén)適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測(cè)目的的數(shù)據(jù)處理系統(tǒng)或方法;其他類(lèi)目不包含的專(zhuān)門(mén)適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測(cè)目的的處理系統(tǒng)或方法
G06Q30-00 商業(yè),例如購(gòu)物或電子商務(wù)
G06Q30-02 .行銷(xiāo),例如,市場(chǎng)研究與分析、調(diào)查、促銷(xiāo)、廣告、買(mǎi)方剖析研究、客戶管理或獎(jiǎng)勵(lì);價(jià)格評(píng)估或確定
G06Q30-04 .簽單或開(kāi)發(fā)票
G06Q30-06 .購(gòu)買(mǎi)、出售或租賃交易
G06Q30-08 ..拍賣(mài)
- 相似圖像提取裝置、相似圖像提取方法以及相似圖像提取程序
- 一種鋼結(jié)構(gòu)火災(zāi)反應(yīng)分析方法
- 相似度計(jì)算裝置、相似度計(jì)算方法以及相似度計(jì)算程序
- 一種蛋白質(zhì)相似度及相似蛋白質(zhì)的確定方法和系統(tǒng)
- 一種獲取相似語(yǔ)句的方法、裝置、存儲(chǔ)介質(zhì)及電子設(shè)備
- 一種圖像搜索方法、裝置和存儲(chǔ)介質(zhì)
- 基于相似壽命模型和相似壽命的復(fù)雜產(chǎn)品可靠性評(píng)定方法
- 獲取機(jī)構(gòu)技術(shù)相似性的方法及裝置
- 口罩(相似)
- 臺(tái)燈(相似)
- 生成評(píng)估方案的方法及裝置
- 一種基于PDCA環(huán)的評(píng)估方法及裝置
- 金融產(chǎn)品評(píng)估系統(tǒng)及方法
- 一種軍事演習(xí)演練量化評(píng)估系統(tǒng)
- 一種通過(guò)聲音進(jìn)行質(zhì)量評(píng)估的方法及裝置
- 一種項(xiàng)目評(píng)估方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 一種品性循環(huán)評(píng)估方法
- 基于組件的評(píng)估模型裝配方法及系統(tǒng)
- 一種綜合評(píng)估的方法和系統(tǒng)
- 產(chǎn)品的質(zhì)量評(píng)估方法及裝置
- 一種數(shù)據(jù)庫(kù)讀寫(xiě)分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





