[發明專利]異常數據檢測方法及裝置有效
| 申請號: | 201610144138.8 | 申請日: | 2016-03-14 |
| 公開(公告)號: | CN107193824B | 公開(公告)日: | 2020-07-28 |
| 發明(設計)人: | 張輝 | 申請(專利權)人: | 阿里巴巴集團控股有限公司 |
| 主分類號: | G06F16/9537 | 分類號: | G06F16/9537 |
| 代理公司: | 北京國昊天誠知識產權代理有限公司 11315 | 代理人: | 黃熊 |
| 地址: | 英屬開曼群島大開*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 異常 數據 檢測 方法 裝置 | ||
本申請實施例公開了一種異常數據檢測方法及裝置。所述異常數據檢測方法包括:接收待檢測的用戶位置數據;根據用戶位置數據的時間,對用戶位置數據進行排序;根據排序后的所述用戶位置數據中的地區,計算各個用戶位置數據與前后用戶位置數據之間地區的變化程度,得到各個用戶位置數據的地區一致性特征;判斷是否存在大于預設閾值的所述地區一致性特征;若是,將所述大于預設閾值的地區一致性特征對應的用戶位置數據確定為異常數據。利用本申請實施例,可以有效地檢測出用戶位置數據是否存在異常。
技術領域
本申請涉及互聯網技術領域,特別涉及一種異常數據檢測方法及裝置。
背景技術
隨著互聯網技術的不斷發展,各種帶給用戶便利的互聯網服務不斷出現,例如地圖、O2O(Online To Offline)等互聯網服務。
通常,互聯網公司的服務器對外提供上述互聯網服務時,會采集用戶使用過程中產生的用戶位置數據,所述用戶位置數據包括時間、經緯度和地區。一般的,所述用戶位置數據可以記作p{t,l,r},其中,t代表時間(采集到用戶位置的時間);l代表經緯度(采集到用戶位置的經緯度);r代表地區(采集到用戶位置所在的第一類行政區、第二類行政區、第三類行政區。其中,所述第一類行政區、第二類行政區、第三類行政區可以是適用于不同國家的行政區劃分;例如中國,第一類行政區可以為省,第二類行政區可以為市,第三類行政區可以為區;例如美國,第一類行政區可以為洲,第二類行政區可以為郡,第三類行政區可以為市)。所述地區可以由所述經緯度計算確定。例如,某個用戶位置數據p{20160222135520,(120.11404,30.281157),浙江省杭州市西湖區}。其中所述用戶位置數據p中時間t為20160222135520(2016年02月22日13點55分20秒);經緯度l為經度120.11404,緯度為30.281157;地區為浙江省杭州市西湖區(經度120.11404,維度為30.281157對應的地區為浙江省杭州市西湖區)。隨著使用互聯網服務的用戶越來越多,服務器采集的用戶位置數據也越來越多,這些采集得到用戶位置數據還可以存儲入數據庫中。然而由于采集用戶位置數據時可能出現錯誤,例如采集到的用戶位置數據中的經緯度出現偏差,就會導致用戶位置數據出現異常?;蛘?,用戶賬戶被盜用的情況中,采集到的用戶位置數據中地區出現異常,例如半小時前還在浙江省杭州市,半小時后出現在北京市的情況。
現有技術中,檢測異常的用戶位置數據,通常利用聚類的方法,即將相似的用戶位置數據(如用戶位置數據中地區相同的)聚類,然后將不能聚類的用戶位置數據確定為異常數據。然而,異常數據并不依賴與是否聚類,即聚類的數據也可能存在異常,不聚類的數據不一定存在異常。
綜上所述,現有技術中存在無法有效地檢測用戶位置數據是否存在異常。
發明內容
本申請實施例的目的是提供一種異常數據檢測方法及裝置,用以解決現有技術中無法有效地檢測用戶位置數據是否存在異常的問題。
為解決上述技術問題,本申請實施例提供的異常數據檢測方法及裝置是這樣實現的:
一種異常數據檢測方法,包括:
接收待檢測的用戶位置數據;
根據用戶位置數據的時間,對所述用戶位置數據進行排序;
根據排序后的所述用戶位置數據中的經緯度,計算各個用戶位置數據與前后用戶位置數據之間距離的平均值,得到各個用戶位置數據的距離特征;
根據排序后的所述用戶位置數據中的時間,計算各個用戶位置數據與前后用戶位置數據之間時間的平均值,得到各個用戶位置數據的時間特征;
根據各個用戶位置數據的距離特征和時間特征,計算得到各個用戶位置數據的速度特征;
判斷是否存在大于預設速度的所述速度特征;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于阿里巴巴集團控股有限公司,未經阿里巴巴集團控股有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610144138.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:頁面提供方法和裝置、第三方平臺以及服務提供裝置
- 下一篇:頁面統計方法和裝置
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





