[發明專利]數據檢測方法、裝置和電子設備在審
| 申請號: | 202110911210.6 | 申請日: | 2021-08-09 |
| 公開(公告)號: | CN113672675A | 公開(公告)日: | 2021-11-19 |
| 發明(設計)人: | 漆星星;李倩;余韞懿;趙鴻飛;徐志豪;賴力 | 申請(專利權)人: | 北京字跳網絡技術有限公司 |
| 主分類號: | G06F16/26 | 分類號: | G06F16/26;G06K9/62 |
| 代理公司: | 泰和泰律師事務所 51219 | 代理人: | 祝海燕 |
| 地址: | 100190 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據 檢測 方法 裝置 電子設備 | ||
本公開實施例公開了的數據檢測方法、裝置和電子設備,通過對初始數據集合進行至少兩次數據提取,獲得至少兩個子數據集合,然后又從子數據集合中隨機抽取部分數據作為待檢測數據,使得僅需檢測待檢測數據,即可確定初始數據集合是否符合預設標準。這樣,即可利用較少的數據,實現對大量數據的檢測,從而增加了對初始數據集合的檢測效率。
技術領域
本公開涉及互聯網技術領域,尤其涉及一種數據檢測方法、裝置和電子設備。
背景技術
隨著計算機科學技術的發展,會產生海量的數據,而這些數據中可能有些數據是不正常的,而數據異常檢測技術則是將檢測海量數據中是否存在異常數據(不正常的數據)。
目前,在進行數據異常檢測時,通過專家經驗確定異常數據的一些特征,并對這些特征進行標注,之后,可以讓機器學習異常數據的特征,從而實現檢測海量數據中的異常數據。
發明內容
提供該公開內容部分以便以簡要的形式介紹構思,這些構思將在后面的具體實施方式部分被詳細描述。該公開內容部分并不旨在標識要求保護的技術方案的關鍵特征或必要特征,也不旨在用于限制所要求的保護的技術方案的范圍。
本公開實施例提供了一種數據檢測方法、裝置和電子設備,可以使得在僅需檢測少量的數據,即可判斷初始數據集合是否符合預設標準,從而提升了對數據型數據集合的檢測效率。
第一方面,本公開實施例提供了一種數據檢測方法,包括:基于初始數據集合中數據的分布特征,對初始數據集合進行至少兩次數據提取,獲得至少兩個子數據集合;對每個子數據集合和所述初始數據集合均進行抽樣,根據抽樣結果,獲得待檢測數據集合;基于所述待檢測數據集合的檢測結果,確定所述初始數據集合是否符合預設標準。
第二方面,本公開實施例提供了一種數據檢測裝置,包括:提取單元,用于基于初始數據集合中數據的分布特征,對初始數據集合進行至少兩次數據提取,獲得至少兩個子數據集合;抽樣單元,用于對每個子數據集合和所述初始數據集合均進行抽樣,根據抽樣結果,獲得待檢測數據集合;確定單元,用于基于所述待檢測數據集合的檢測結果,確定所述初始數據集合是否符合預設標準。
第三方面,本公開實施例提供了一種電子設備,包括:一個或多個處理器;存儲裝置,用于存儲一個或多個程序,當所述一個或多個程序被所述一個或多個處理器執行,使得所述一個或多個處理器實現如第一方面所述的數據檢測方法。
第四方面,本公開實施例提供了一種計算機可讀介質,其上存儲有計算機程序,該程序被處理器執行時實現如第一方面所述的數據檢測方法的步驟。
本公開實施例提供的數據檢測方法、裝置和電子設備,通過對初始數據集合進行至少兩次數據提取,獲得至少兩個子數據集合,然后又從子數據集合中隨機抽取部分數據作為待檢測數據,使得僅需檢測待檢測數據,即可確定初始數據集合是否符合預設標準。這樣,即可利用較少的數據,實現對大量數據的檢測,從而增加了對初始數據集合的檢測效率。
附圖說明
結合附圖并參考以下具體實施方式,本公開各實施例的上述和其他特征、優點及方面將變得更加明顯。貫穿附圖中,相同或相似的附圖標記表示相同或相似的元素。應當理解附圖是示意性的,原件和元素不一定按照比例繪制。
圖1是根據本公開的數據檢測方法的一個實施例的流程圖;
圖2是根據本公開的數據檢測方法的一個實施例的數據分布示意圖;
圖3是根據本公開的數據檢測方法的又一個實施例的數據分布示意圖;
圖4是根據本公開的數據檢測方法的又一個實施例的數據分布示意圖;
圖5是根據本公開的數據檢測方法的又一個實施例的數據分布示意圖;
圖6是根據本公開的數據檢測裝置的一個實施例的結構示意圖;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京字跳網絡技術有限公司,未經北京字跳網絡技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110911210.6/2.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





