[發明專利]用戶起訖點聚類分析方法、裝置及存儲介質在審
| 申請號: | 201811465250.7 | 申請日: | 2018-12-03 |
| 公開(公告)號: | CN109508750A | 公開(公告)日: | 2019-03-22 |
| 發明(設計)人: | 楊帆 | 申請(專利權)人: | 斑馬網絡技術有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 北京同立鈞成知識產權代理有限公司 11205 | 代理人: | 吳會英;劉芳 |
| 地址: | 200030 上海*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 行車數據 聚類結果 聚類 聚類簇 準確度 車載用戶 存儲介質 聚類分析 預設規則 坐標數據 減小 | ||
本發明提供一種用戶起訖點聚類分析方法、裝置及存儲介質,其中,該方法包括:首先,獲取車載用戶對應的行車數據集,行車數據集包括至少一個行車數據,行車數據包括坐標數據;接著,根據每個行車數據對應的局部密度以及密度距離,確定聚類數;然后,根據預設規則以及聚類數,對行車數據集中的行車數據進行聚類,獲取聚類簇;進一步,根據聚類簇中的簇核數據,獲取聚類結果,其中,聚類結果表示車載用戶的起點或終點。本發明提供的方法,通過根據行車數據對應的局部密度以及密度距離,確定聚類數,提高了聚類結果的準確度;進一步,通過根據聚類簇中的簇核數據,獲取聚類結果,減小了離群點對聚類結果的影響,從而提高了聚類結果的準確度。
技術領域
本發明涉及智能交通技術領域,尤其涉及一種用戶起訖點聚類分析方法、裝置及存儲介質。
背景技術
車載裝置通常會記錄車輛的行車數據,例如:經緯度坐標、行駛速度以及時間等等。通過這些行車數據,我們可以得到用戶的每次出行的起訖點(起訖點:表示起點和終點),從而為車載用戶提供更好的車載服務。
現有技術中,通常采用以DBSCAN算法為代表的基于密度的方法對行車數據進行聚類分析,獲取車載用戶的起訖點。
但是,上述方法對參數的敏感程度較高,當聚類的稀疏程度不同時,相同的判定標準可能會破壞聚類的自然結構,即較稀的聚類會被劃分為多個類或密度較大的且離得較近的多個類會被合并成一個聚類,導致起訖點質心與實際起訖點質心有較大的偏移,也就是說,聚類結果準確度較低。
發明內容
本發明提供一種用戶起訖點聚類分析方法、裝置及存儲介質,以提高聚類結果的準確度。
第一方面,本發明提供一種用戶起訖點聚類分析方法,包括:
獲取預設時間段內車載用戶對應的行車數據集,所述行車數據集包括至少一個行車數據,所述行車數據包括坐標數據;
根據每個所述行車數據對應的局部密度以及密度距離,確定聚類數;
根據預設規則以及所述聚類數,對所述行車數據集中的行車數據進行聚類,獲取聚類簇;
根據所述聚類簇中的簇核數據,獲取聚類結果,所述聚類結果表示所述車載用戶的起點或終點。
可選地,所述根據每個所述行車數據對應的局部密度以及密度距離,確定聚類數之前,還包括:
根據預設截斷距離,獲取每個所述行車數據對應的局部密度以及密度距離。
可選地,所述根據每個所述行車數據對應的局部密度以及密度距離,確定聚類數,包括:
將每個所述行車數據對應的局部密度以及密度距離分別進行相乘,根據所述乘積的斜率變化趨勢,確定為聚類數。
可選地,所述根據所述聚類簇中的簇核數據,獲取聚類結果之前,還包括:
通過以下方式確定所述聚類簇中的簇核數據:
根據所述聚類簇中行車數據對應的局部密度,獲取所述聚類簇對應的局部密度參考值;
根據所述聚類簇中行車數據對應的局部密度以及所述聚類簇對應的局部密度參考值,確定所述聚類簇中的簇核數據。
可選地,所述根據所述聚類簇中行車數據對應的局部密度,獲取所述聚類簇對應的局部密度參考值,包括:
將所述聚類簇中行車數據對應的局部密度的平均值,確定為所述局部密度參考值。
可選地,所述根據所述聚類簇中行車數據對應的局部密度以及所述聚類簇對應的局部密度參考值,確定所述聚類簇中的簇核數據,包括:
若所述聚類簇中行車數據對應的局部密度大于所述聚類簇對應的局部密度參考值,則確定所述行車數據為簇核數據;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于斑馬網絡技術有限公司,未經斑馬網絡技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811465250.7/2.html,轉載請聲明來源鉆瓜專利網。





