[發明專利]一種基于空間序列數據分析的用戶軌跡隱私保護方法有效
| 申請號: | 201610028542.9 | 申請日: | 2016-01-15 |
| 公開(公告)號: | CN105701418B | 公開(公告)日: | 2018-08-14 |
| 發明(設計)人: | 桂小林;冀亞麗;楊廣知;張晨;張開元;李敬;代兆勝 | 申請(專利權)人: | 西安交通大學 |
| 主分類號: | G06F21/62 | 分類號: | G06F21/62;G06F17/30 |
| 代理公司: | 西安通大專利代理有限責任公司 61200 | 代理人: | 徐文權 |
| 地址: | 710049 陜*** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 空間 序列 數據 分析 用戶 軌跡 隱私 保護 方法 | ||
1.一種基于空間序列數據分析的用戶軌跡隱私保護方法,其特征在于,包括以下步驟:
A.提取個人興趣點:對每個移動用戶的空間序列數據進行聚類分析;
B.構建公共興趣區:對全體用戶的興趣點按時間分區進行聚類分析;
C.在公共興趣區內交換位置:對同一個興趣區內的用戶位置進行隨機交換;
步驟A具體包括以下步驟:
A1:對于每個移動用戶一天內所有的采樣位置,使用基于密度的聚類方法對其進行聚類,并根據聚類結果生成聚類索引;
A2:根據指定的時間閾值和漂移點個數閾值,使用基于時間序列的方法對每個移動用戶的聚類索引進行分析,修改不能形成興趣區的采樣點的聚類索引、漂移點的聚類索引,生成每個用戶的個人興趣區索引;
A3:將個人興趣區索引中數值相同的采樣點按照指定的方式生成個人興趣點;
步驟A1具體包括以下步驟:
設置位置矩陣MOS表示某一天所有用戶的所有采樣位置,其中行向量代表一個用戶,列向量代表某一采樣時刻;設采樣時間間隔為t,t的計量單位為秒;用戶總數為NOS;矩陣MOS中元素為mosi,j,其中i=1,2,…,nOS;j=1,2,…,mOS,行數nOS=NOS,列數mOS為:
設給定的時間閾值為Ts,給定的聚類半徑為RSP,采用DBSCAN進行聚類時設置Eps=RSP;聚類區域中所包含的點數的最小值MinPts為:
根據DBSCAN聚類結果生成的聚類索引矩陣ICR;ICR的元素為icri,j,ICR大小與MOS相同;
步驟A2具體包括以下步驟:
根據指定的時間閾值和漂移點個數閾值,使用基于時間序列的方法對每個移動用戶的聚類索引進行分析,修改不能形成興趣區的采樣點的聚類索引、漂移點的聚類索引,生成每個用戶的個人興趣區索引;
對于需要修改的聚類索引,通過矩陣約簡的過程發現并修改;矩陣約簡的具體方法如下:構造以Ts為時間間隔的矩陣IDR和與IDR大小相同的矩陣TDR1和TDR2,矩陣IDR的行數與ICR的行數相同,即nDR=nCR=nOS=NOS,矩陣IDR的列數mDR為:
IDR中元素為idri,j,其中i=1,2,…,nDR,j=1,2,…,mDR,使得:
其中k是與j*Ts最接近的采樣時刻;
在形成IDR的過程中,對每一個j*Ts到(j+1)*Ts時間段內的Ts/t列采樣數據,僅保留了2列,其中j=1,2,…,mDR-1;引入與IDR相應大小的矩陣TDR1和TDR2來記錄idri,j在j*Ts到(j+1)*Ts內的結束時刻和idri,j+1在j*Ts到(j+1)*Ts內的開始時刻;
在形成TDR1和TDR2的過程中,發現漂移點和一部分不能構成興趣區的采樣點;在形成TDR1和TDR2后,通過計算tdr1i,j+1與tdr2i,j的差值,發現其他的不能構成興趣區的采樣點;
對于漂移點,將其聚類索引值修改為鄰近采樣點的聚類索引值,對于不能構成興趣區的采樣點,將其聚類索引值修改為噪聲點的索引值;修改聚類索引后生成的索引矩陣IIA表示對應用戶的個人興趣區索引;索引矩陣IIA的元素為iiai,j,大小與ICR相同;
步驟A3具體包括以下步驟:
索引矩陣IIA的每一行對應一個用戶的個人興趣區索引,個人興趣區索引值相同的采樣點構成了此用戶的一個個人興趣區;個人興趣區中所有采樣點的位置數據反映在二維坐標平面上可形成一個區域,個人興趣點通過指定方式對區域中的采樣點進行處理得到;
根據個人興趣區索引IIA將MOS中的采樣點位置變成相應的個人興趣點位置,即設置與矩陣MOS大小相同的矩陣MIP,MIP的行數nIP=nOS=NOS,列數mIP=mOS,MIP中元素為mipi,j,其中i=1,2,…,nOS,j=1,2,…,mOS,使得:
其中(x,y)i表示MOS中第i行的某個興趣點位置,A(x,y)i表示此興趣點對應的興趣區,Pi表示第i行所有興趣點位置的集合;
步驟B具體包括以下步驟:
B1:對指定時間范圍內所有用戶的個人興趣點,使用基于密度的聚類方法對其進行聚類,根據聚類結果生成指定時間范圍內每個采樣時刻的公共興趣區索引;
B2:將指定時間范圍內的公共興趣區索引中數值相同的個人興趣點按照指定的方式生成公共興趣點;
步驟B1具體包括以下步驟:
設SIPi(tb,te)表示MIP中指定時間范圍內第i行所有興趣點的集合;其中i=1,2,…,nOS,指定時間范圍為tb采樣時刻至te采樣時刻,SIPi(tb,te)中無重復元素;SPA(tb,te)表示所有SIPi的并集,即:
SPA(tb,te)=∪SIPi(tb,te) (6)
對SPA(tb,te)的nspa個元素采用DBSCAN進行聚類,設置Eps=RSP和MinPts=k,得到SPA(tb,te)中所有元素spau(tb,te)分別對應的聚類索引值ispau(tb,te);其中u=1,2,…,nspa;根據SPA(tb,te)的聚類索引,生成tb采樣時刻至te采樣時刻內每個采樣時刻的公共興趣區索引即的元素為ipa(tb,te)i,j其中i=1,2,…,nos,j=b,b+1,…,e-1,e,使得:
步驟B2具體包括以下步驟:
索引矩陣中公共興趣區索引值相同的個人興趣點構成了此時間范圍內的一個公共興趣區。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西安交通大學,未經西安交通大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610028542.9/1.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





