[發明專利]一種預測目的地地址的方法及系統在審
| 申請號: | 201811454961.4 | 申請日: | 2018-11-30 |
| 公開(公告)號: | CN109636020A | 公開(公告)日: | 2019-04-16 |
| 發明(設計)人: | 寧春貴 | 申請(專利權)人: | 廣州亞美信息科技有限公司 |
| 主分類號: | G06Q10/04 | 分類號: | G06Q10/04;G06K9/62 |
| 代理公司: | 北京輕創知識產權代理有限公司 11212 | 代理人: | 楊立;黃啟法 |
| 地址: | 510000 廣東省廣州市天河區翰*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 目的地地址 預測 候選坐標 坐標數據 聚合 運算 分布式并行計算 海量用戶 聚類運算 密度聚類 數據采用 終端設備 算法 并行 | ||
本發明公開一種預測目的地地址的方法及系統。該方法包括:由分布式并行計算框架下的不同終端設備獲取被拆分后的目的地地址候選坐標數據;將所述獲取的目的地地址候選坐標數據采用密度聚類算法并行進行聚類運算,分別得到運算后的目的地地址坐標數據;將所述分別得到的運算后的目的地地址坐標數據進行匯總聚合,將匯總聚合后的目的地地址作為預測地址。本發明提供的方案,能更準確和快速地預測海量用戶的目的地地址。
技術領域
本發明涉及車聯網技術領域,具體涉及一種預測目的地地址的方法及系統。
背景技術
隨著汽車技術和車聯網技術的不斷發展進步,車聯網大數據的應用逐漸廣泛。例如,可以根據大數據對車輛用戶的家庭地址或公司地址等目的地地址進行預測。
目前對車輛用戶的家庭地址或公司地址進行預測的方法,大部分是在單臺PC環境下,基于用戶常去地址的GPS(Global Positioning System,全球定位系統)坐標,使用K-Means(K均值)或KNN(K-NearestNeighbor,K最近鄰)等算法進行聚類,然后將聚類后的結果作為用戶可能的家庭地址或公司地址。其中,K-Means算法是一種典型的基于距離的聚類算法,采用距離作為相似性的評價指標,即認為兩個對象的距離越近,其相似度就越大;而KNN算法的核心思想是如果一個樣本在特征空間中的K個最相鄰的樣本中的大多數屬于某一個類別,則該樣本也屬于這個類別,并具有這個類別上樣本的特性。
但是,現有技術的目的地地址預測方法大多是針對少量用戶的,例如通常是幾千個以下用戶,并且運行環境為單臺PC,使用的聚類算法時間復雜度也較高,隨數據的增長所需的運行時長也成倍增長,從而導致對百萬及以上的用戶數量就無能為力,另外還有預測算法耗時較長、預測結果準確度不高等缺點。
發明內容
有鑒于此,本發明的目的在于提出一種預測目的地地址的方法及系統,能更準確和快速地預測海量用戶的目的地地址。
根據本發明的一個方面,提供一種預測目的地地址的方法,包括:
由分布式并行計算框架下的不同終端設備獲取被拆分后的目的地地址候選坐標數據;
將所述獲取的目的地地址候選坐標數據采用密度聚類算法并行進行聚類運算,分別得到運算后的目的地地址坐標數據;
將所述分別得到的運算后的目的地地址坐標數據進行匯總聚合,將匯總聚合后的目的地地址作為預測地址。
優選的,所述由分布式并行計算框架下的不同終端設備獲取被拆分后的目的地地址候選坐標數據之前,還包括:
將用戶設定時間段內的行程記錄數據進行預處理,得到目的地地址候選坐標數據。
優選的,所述將用戶設定時間段內的行程記錄數據進行預處理,得到目的地地址候選坐標數據,包括:
將用戶設定時間段內的行程記錄數據中的目的地地址坐標,聚合到候選坐標表的同一行作為目的地地址候選坐標數據。
優選的,所述將用戶設定時間段內的行程記錄數據中的目的地地址坐標,聚合到候選坐標表的同一行作為目的地地址候選坐標數據,包括:
將用戶設定時間段內的行程記錄數據中,選取設定時間點內的第一次停車和最后一次停車的地址坐標數據,分別作為公司地址候選坐標數據及家庭地址候選坐標數據,將所述選取的公司地址候選坐標數據及家庭地址候選坐標數據分別聚合到候選坐標表的同一行。
優選的,所述將所述獲取的目的地地址候選坐標數據采用密度聚類算法并行進行聚類運算,分別得到運算后的目的地地址坐標數據,包括:
遍歷所述候選坐標表的每行目的地地址候選坐標數據;
采用密度聚類算法判斷所述目的地地址候選坐標中的核心點;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州亞美信息科技有限公司,未經廣州亞美信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811454961.4/2.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





