[發明專利]一種地址相似度評估方法有效
| 申請號: | 201711254896.6 | 申請日: | 2017-12-04 |
| 公開(公告)號: | CN108171529B | 公開(公告)日: | 2021-09-14 |
| 發明(設計)人: | 龍華;祁俊輝;邵玉斌;杜慶治 | 申請(專利權)人: | 昆明理工大學 |
| 主分類號: | G06Q30/02 | 分類號: | G06Q30/02;G06F40/279;G06F40/289 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 650093 云*** | 國省代碼: | 云南;53 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 地址 相似 評估 方法 | ||
1.一種地址相似度評估方法,其特征在于,具體包括以下步驟:
Step1:獲取待比較地址X的地址文本strx及該地址對應的經緯度坐標(Ex,Nx)和目標地址Y的地址文本stry及該地址對應的經緯度坐標(Ey,Ny);
Step2:對待比較地址X的地址文本strx和目標地址Y的地址文本stry進行預處理,采用命名實體識別技術和地址詞庫對其進行六段式分詞,對不足六段式的地址進行補充,得到待比較地址X的地址詞集合X:{x1,x2…x6}和目標地址Y的地址詞集合Y:{y1,y2…y6};
Step3:對待比較地址X的地址詞集合X:{x1,x2…x6}和目標地址Y的地址詞集合Y:{y1,y2…y6}以六段式設權重,對應權重集合為W:{w1,w2…w6};
Step4:以待比較地址X的地址文本strx和目標地址Y的地址文本stry作為輸入,采用字符串相似算法Jaro-WinlerDistance對其進行相似度的計算,得到待比較地址X和目標地址Y之間基于地址文本的相似度Sim1(X,Y);
Step5:以待比較地址X的經緯度坐標(Ex,Nx)和目標地址Y的經緯度坐標(Ey,Ny)作為輸入,采用坐標轉換及勾股定理,計算待比較地址X和目標地址Y的直線距離lxy,給出誤差范圍Δl,由公式(1)計算待比較地址X和目標地址Y之間基于經緯度坐標的相似度Sim2(X,Y);
Step6:以待比較地址X的地址詞集合X:{x1,x2…x6}和目標地址Y的地址詞集合Y:{y1,y2…y6}作為輸入,以權重集合W:{w1,w2…w6}作為標準,生成特征向量FX={fx1,fx2…fxg}和FY={fy1,fy2…fyg},由余弦定理確定待比較地址X和目標地址Y之間基于詞集合的相似度Sim3(X,Y);
Step7:設Step4、Step5、Step6步驟所計算出的相似度對應權值分別為α、β、γ,權值α、β、γ滿足α+β+γ=1的要求,由相似度Sim1(X,Y)及權值α、相似度Sim2(X,Y)及權值β、相似度Sim3(X,Y)及權值γ,由公式(2)計算出待比較地址X和目標地址Y之間的最終相似度Sim(X,Y);
Sim(X,Y)=Sim1(X,Y)·α+Sim2(X,Y)·β+Sim3(X,Y)·γ (2);
所述步驟Step2中,六段式分詞具體指按照行政區域劃分,即按照省、市、縣、鎮、村和其他劃分,所述省包括自治區、直轄市,所述市包括州,所述縣包括區,所述鎮包括鄉、街道,所述村包括路,對不足六段式的地址通過經緯度查找地址詞庫進行補充;
所述步驟Step3中權重集合W:{w1,w2…w6},是對六段式地址信息的每段設置權重,該權重需滿足公式:w1<w2<w3<w4>w5>w6的要求;
所述步驟Step7中,相似度對應權值α、β、γ需滿足β<α<γ的要求。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于昆明理工大學,未經昆明理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711254896.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種青瓷的制備方法
- 下一篇:一種固定化復合藻微球及其應用





