[發明專利]一種基于先驗知識的網約車相似地址識別方法在審
| 申請號: | 202110444736.8 | 申請日: | 2021-04-24 |
| 公開(公告)號: | CN113204612A | 公開(公告)日: | 2021-08-03 |
| 發明(設計)人: | 趙剛 | 申請(專利權)人: | 上海賽可出行科技服務有限公司 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/36;G06Q50/30 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 200131 上海市浦東新區自由貿*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 先驗 知識 網約車 相似 地址 識別 方法 | ||
本發明公開了一種基于先驗知識的網約車相似地址識別方法,包括以下步驟:S1、對于同一個城市,按經緯度劃分方形單元網格;S2、初始化文本相似度模型M;S3、根據用戶打車歷史定位,統計城市內地址被使用次數k,記作k=f(e);S4、對單元網格內的地址,兩兩計算文本相似度r=g(e1,e2),相似度rα歸于一類。本發明提供了一種基于先驗知識的網約車相似地址識別方法,計算地址相似度可用于識別出相同地址,對于構建知識圖譜具有重要作用;傳統的文本計算相似度的方法無法有效利用先驗知識,具有準確率低的問題;對于網約車服務因具有城市,經緯度兩項先驗知識,在此基礎上,可以提升識別準確率。
技術領域
本發明涉及網約車、旅游等位置服務(LBS)領域,特別涉及一種基于先驗知識的網約車相似地址識別方法。
背景技術
位置服務在互聯網的發展中起重要作用,網約車行業中,需要位置服務定位司機和乘客的位置,以便司機及時找到乘客。而交通管制以及實際路況中,可用于上車點的位置是固定的幾個。識別地理位置相似的點為同一個位置,把此位置作為用戶常用的上車點的推薦,以及據此數據分析用戶行為,構建知識圖譜,提供個性化服務。
業界以前提供的是文本相似度算法和判定2個地址為同一位置。這種算法因缺少地理經緯度信息,難以準確判斷是同一位置。
基于此,本發明公開了一種基于先驗知識的網約車相似地址識別方法,能精確識別用戶常用地址,作為推薦上車點。
發明內容
本發明要解決的技術問題是克服現有技術的缺陷,提供一種基于先驗知識的網約車相似地址識別方法。
為了解決上述技術問題,本發明提供了如下的技術方案:
本發明提供一種基于先驗知識的網約車相似地址識別方法,包括以下步驟:
S1、對于同一個城市,按經緯度劃分方形單元網格,其起點為(0,n),(n,n),(2n,n),(3n,n)...,方形網格大小為n,城市分割為(w*n,h*n)的矩形,w*n為城市長度,h*n為城市寬度;
S2、初始化文本相似度模型M,具體操作為把該城市所有地址使用word2vec建立模型,所得相似度模型函數記作g(e1,e2);
S3、根據用戶打車歷史定位,統計城市內地址被使用次數k,記作k=f(e);
S4、對單元網格內的地址,兩兩計算文本相似度r=g(e1,e2),相似度rα歸于一類,其中α為預設的參數,共計分為x類,同一類的存入集合,則得到獨立集合q1,q2,q3…qx;
S5、處理邊界問題,按起點為(-n/2,-n/2),(n/2,n/2),(3n/2,n/2)...劃分方形單元網格,處理虛線網格單元,兩兩計算文本相似度r=g(e1,e2),相似度rα歸于一類,其中α為預設的參數,共計分為y類,同一類的存入獨立集合,則得到集合p1,p2,p3…py;
S6、q1,q2,q3…qx與p1,p2,p3…py含有相同元素的合并,合并規則如下所示:
I:qi(1≤i≤x)中元素若存在于pj(1≤j≤y)中,則對應的集合合并;
II:pj(1≤j≤y)中元素若存在于qi(1≤i≤x)中,則對應的集合合并;
III:qi(1≤i≤x)中元素若存在于qj(1≤j≤x)中,i≠j,則對應的集合合并;
IV:pj(1≤j≤y)中元素若存在于pi(1≤i≤y)中,i≠j,則對應的集合合并;
重復上述規則,直至不再有可合并的集合;最終形成h1,h2,h3…hw;hi∩hj=φ,(1≤i≤w,1≤j≤w,i≠j);
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海賽可出行科技服務有限公司,未經上海賽可出行科技服務有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110444736.8/2.html,轉載請聲明來源鉆瓜專利網。





