[發(fā)明專利]一種基于稀疏表示和Fréchet距離融合的軌跡相似度計(jì)算方法有效
| 申請(qǐng)?zhí)枺?/td> | 202010026567.1 | 申請(qǐng)日: | 2020-01-10 |
| 公開(kāi)(公告)號(hào): | CN111259098B | 公開(kāi)(公告)日: | 2023-04-11 |
| 發(fā)明(設(shè)計(jì))人: | 李芳;趙文婷;藍(lán)如師;劉憶寧;鐘艷如;臧美美;鄭金云;王如月;羅笑南 | 申請(qǐng)(專利權(quán))人: | 桂林電子科技大學(xué) |
| 主分類號(hào): | G06F16/29 | 分類號(hào): | G06F16/29;G06F16/28 |
| 代理公司: | 桂林市華杰專利商標(biāo)事務(wù)所有限責(zé)任公司 45112 | 代理人: | 陸夢(mèng)云 |
| 地址: | 541004 廣西*** | 國(guó)省代碼: | 廣西;45 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 稀疏 表示 fr chet 距離 融合 軌跡 相似 計(jì)算方法 | ||
本發(fā)明公開(kāi)了一種基于稀疏表示和Fréchet距離融合的軌跡相似度計(jì)算方法,該方法首先通過(guò)求解每條軌跡用其他軌跡稀疏表示下的各個(gè)系數(shù)大小,從而得到一個(gè)系數(shù)矩陣,再利用Fréchet距離對(duì)任意兩條軌跡做空間曲線相似度計(jì)算,得到一個(gè)相似度矩陣,然后將這兩種方法得到的相似度進(jìn)行加權(quán)融合,求出每條軌跡相似度最高的Top?k個(gè)軌跡鄰居。本發(fā)明提出了考慮軌跡多種特征屬性以及時(shí)空距離融合的方法來(lái)度量軌跡間的相似度,然后在此相似度基礎(chǔ)上進(jìn)行聚類,從而提高軌跡聚類效果。
技術(shù)領(lǐng)域
本發(fā)明涉及計(jì)算機(jī)科學(xué)與技術(shù)領(lǐng)域,具體是一種基于稀疏表示和Fréchet距離融合的軌跡相似度計(jì)算方法。
背景技術(shù)
定位技術(shù)的發(fā)展以及智能移動(dòng)終端的普及,催生了大量的軌跡數(shù)據(jù)。軌跡數(shù)據(jù)采集之后可直接發(fā)布供用戶使用,但直接發(fā)布很可能導(dǎo)致移動(dòng)對(duì)象的個(gè)人敏感信息被泄漏。大量數(shù)據(jù)挖掘工具的使用要求數(shù)據(jù)所有者在發(fā)布軌跡數(shù)據(jù)時(shí)保證數(shù)據(jù)中的敏感信息不被泄露,同時(shí)還要兼顧所發(fā)布軌跡數(shù)據(jù)的可用性。
大量研究表明,基于聚類的軌跡隱私保護(hù)方法在隱私保護(hù)程度上和數(shù)據(jù)可用性上取得了較好的平衡,是目前主流的軌跡隱私保護(hù)方法之一?;诰垲惖能壽E隱私保護(hù)方法中聚類結(jié)果對(duì)匿名軌跡數(shù)據(jù)可用性的影響較大,而軌跡間相似性的度量方式是軌跡聚類的關(guān)鍵。目前大多數(shù)以歐式距離作為軌跡相似性度量標(biāo)準(zhǔn),方法單一??紤]到軌跡多特性,需要融合多相似度計(jì)算。
發(fā)明內(nèi)容
本發(fā)明的目的是要提供一種基于稀疏表示和Fréchet距離融合的軌跡相似度計(jì)算方法,該方法通過(guò)融合兩種分別針對(duì)軌跡不同屬性的相似度計(jì)算方法,充分考慮了軌跡的多特征對(duì)聚類效果的影響,最終推薦相似度最高的K條軌跡進(jìn)行聚類。
實(shí)現(xiàn)本發(fā)明目的的技術(shù)方案是:
一種基于稀疏表示和Fréchet距離融合的軌跡相似度計(jì)算方法,包括如下步驟:
(1)稀疏表示系數(shù)求解相似度sim1,將需要求解相似鄰居的軌跡表示為測(cè)試樣本,數(shù)據(jù)集中除測(cè)試樣本之外其他的軌跡表示為訓(xùn)練樣本,建立用戶軌跡的矩陣形式:
其中每一行表示的是該軌跡上等時(shí)間間隔選取的m個(gè)軌跡點(diǎn),每個(gè)軌跡點(diǎn)有v個(gè)屬性,比如經(jīng)度,緯度,速度,方向等,Rm,v代表軌跡上第m個(gè)軌跡點(diǎn)的第v個(gè)屬性值;
(2)對(duì)矩陣軌跡數(shù)據(jù)預(yù)先處理,稀疏表示形式如下:
β=a1α1++a2α2+…+anαn
其中,β為測(cè)試樣本,αi為訓(xùn)練樣本(i=1,2...n),ai為需要求解的系數(shù);
建立用戶軌跡的矩陣數(shù)據(jù)時(shí),軌跡上的取點(diǎn)數(shù)m多于它的屬性個(gè)數(shù)v,;因此將原用戶軌跡矩陣全部做轉(zhuǎn)置處理:
y=a1x1+a2x2+…anxn
xi(i=1,2...n)為轉(zhuǎn)置后的軌跡矩陣t的表示;
(3)對(duì)軌跡矩陣做歸一化處理,每個(gè)矩陣有n個(gè)屬性,每個(gè)屬性的取值范圍不同,歸一化后可以加快梯度下降求最優(yōu)解的速度,也可能提高精度,降低計(jì)算時(shí)間復(fù)雜度;
(4)軌跡間的稀疏表示:
y=a1x1++a2x2+…+anxn
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于桂林電子科技大學(xué),未經(jīng)桂林電子科技大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010026567.1/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。





