[發明專利]一種異常數據的定位方法及裝置在審
| 申請號: | 201710792861.1 | 申請日: | 2017-09-05 |
| 公開(公告)號: | CN107688658A | 公開(公告)日: | 2018-02-13 |
| 發明(設計)人: | 周雙志;周葳 | 申請(專利權)人: | 北京奇藝世紀科技有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京集佳知識產權代理有限公司11227 | 代理人: | 王寶筠 |
| 地址: | 100080 北京市海淀*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 異常 數據 定位 方法 裝置 | ||
技術領域
本發明屬于數據定位技術領域,尤其涉及一種異常數據的定位方法及裝置。
背景技術
在當前大數據背景下,一項數據指標可能對應多個維度,每個維度又分別包括多項細分項。由于每項數據指標包括的數據非常多,因此,對每項數據指標中異常數據的定位變得很困難。以廣告收入為例,廣告收入這一數據指標對應的維度包括播放平臺、廣告主和播放器。播放平臺包括多個不同的平臺即多個平臺細分項,每個平臺細分項分別對應此平臺下的廣告收入數據。廣告主包括多個不同的廣告主即多個廣告主細分項,每個廣告主細分項分別對應此廣告主的廣告收入數據。播放器包括多個不同的播放器即多個播放器細分項,每個播放器細分項分別對應此播放器的廣告收入數據。對廣告收入中的異常數據進行定位的方式是:分別查找每一個維度的數據,然后根據經驗人為地分析到底是哪個維度出現了問題,確定存在異常數據的維度,再分析是此維度下哪個細分項存在異常。
現有技術中,在對異常數據定位的過程中,是通過人為的方式逐一查找每個維度下的數據,這種異常數據定位的方式效率低。
發明內容
有鑒于此,本發明的目的在于提供一種異常數據的定位方法及裝置,用于提高異常數據定位的效率。
技術方案如下:
本發明提供一種異常數據的定位方法,所述定位方法包括:
獲取待定位數據指標對應的所有維度;
根據所述所有維度,獲取與每個維度對應的維度數據和歷史維度數據;其中,所述維度數據包括至少一項細分項數據,所述歷史維度數據包括至少一項歷史細分項數據;
利用所述每個維度的所述維度數據中包括的細分項數據,構建第一向量,利用所述歷史維度數據中包括的歷史細分項數據,構建第二向量;
計算所述每個維度的所述第一向量和所述第二向量之間的相似度,以得到所述每個維度的相似度;
比較所述所有維度的相似度,確定相似度最小值;
定位所述相似度最小值對應的維度。
優選地,所述計算每個維度的所述第一向量和所述第二向量之間的相似度,得到每個維度的相似度,包括:
計算每個維度的所述第一向量和所述第二向量之間的余弦夾角值;
根據所述余弦夾角值,確定每個維度的所述第一向量和所述第二向量之間的相似度。
優選地,所述利用每個維度的所述維度數據中包括的細分項數據,構建第一向量,利用所述歷史維度數據中包括的歷史細分項數據,構建第二向量,包括:
判斷每個維度的所述維度數據中包括的細分項數據的個數與所述歷史維度數據中包括的歷史細分項數據的個數是否相同;
若細分項數據的個數與歷史細分項數據的個數相同,則利用每個維度的所述維度數據中包括的細分項數據,構建第一向量,利用所述歷史維度數據中包括的歷史細分項數據,構建第二向量。
優選地,還包括:
若細分項數據的個數與歷史細分項數據的個數不同,則根據所述維度數據包括的細分項數據,分別查找與每個細分項數據對應的細分項,得到由所述細分項組成的細分項集合;
根據所述歷史維度數據包括的歷史細分項數據,分別查找與每個歷史細分項數據對應的歷史細分項,得到由所述歷史細分項組成的歷史細分項集合
比較所述細分項集合和所述歷史細分項集合;
將所述歷史細分項集合中區別于所述細分項集合的細分項加入到所述細分項集合中,其中,加入到所述細分項集合中的細分項對應的細分項數據為0;
利用加入細分項后的所述細分項集合對應的細分項數據,構建新的第一向量;
將所述細分項集合中區別于所述歷史細分項集合的細分項加入到所述歷史細分項集合中,其中,加入到所述歷史細分項集合中的細分項對應的細分項數據為0;
利用加入細分項后的所述歷史細分項集合對應的細分項數據,構建新的第二向量。
本發明還提供一種異常數據的定位裝置,所述定位裝置包括:
第一獲取單元,用于獲取待定位數據指標對應的所有維度;
第二獲取單元,用于根據所述第一獲取單元獲取到的所有維度,獲取與每個維度對應的維度數據和歷史維度數據;其中,所述維度數據包括至少一項細分項數據,所述歷史維度數據包括至少一項歷史細分項數據;
構建單元,用于利用第二獲取單元獲取到的所述每個維度的所述維度數據中包括的細分項數據,構建第一向量,利用所述歷史維度數據中包括的歷史細分項數據,構建第二向量;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京奇藝世紀科技有限公司,未經北京奇藝世紀科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710792861.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種視頻簡歷的制作系統及其方法
- 下一篇:一種數據處理方法及裝置
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





