[發(fā)明專利]基于時序數(shù)據(jù)的數(shù)據(jù)質(zhì)量檢測方法、檢測裝置及存儲裝置有效
| 申請?zhí)枺?/td> | 202010680801.2 | 申請日: | 2020-07-15 |
| 公開(公告)號: | CN111563078B | 公開(公告)日: | 2020-11-10 |
| 發(fā)明(設計)人: | 吉文標;何林強 | 申請(專利權(quán))人: | 浙江大華技術(shù)股份有限公司 |
| 主分類號: | G06F16/215 | 分類號: | G06F16/215 |
| 代理公司: | 深圳市威世博知識產(chǎn)權(quán)代理事務所(普通合伙) 44280 | 代理人: | 黎堅怡 |
| 地址: | 310051 浙江*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 時序 數(shù)據(jù) 質(zhì)量 檢測 方法 裝置 存儲 | ||
1.一種基于時序數(shù)據(jù)的數(shù)據(jù)質(zhì)量檢測方法,其特征在于,包括:
接收當前時刻下的待檢測時序數(shù)據(jù);
判斷所述待檢測時序數(shù)據(jù)中所包含的周期個數(shù)是否小于等于閾值;
若是,則利用短周期檢測方法對所述待檢測時序數(shù)據(jù)進行檢測;否則,利用長周期檢測方法對所述待檢測時序數(shù)據(jù)進行檢測;
其中,所述利用短周期檢測方法對所述待檢測時序數(shù)據(jù)進行檢測,包括:從所述待檢測時序數(shù)據(jù)中獲取當前滑動窗口時間段內(nèi)的所有數(shù)據(jù);利用所述當前滑動窗口時間段內(nèi)的所有數(shù)據(jù)擬合獲得對應的一維高斯分布模型;逐個判斷當前滑動窗口周圍的數(shù)據(jù)是否符合所述一維高斯分布模型;若所述當前滑動窗口周圍的數(shù)據(jù)中存在不符合所述一維高斯分布模型的數(shù)據(jù),則將不符合的數(shù)據(jù)判定為異常數(shù)據(jù),且將所述異常數(shù)據(jù)跳過后,按照預設滑動步長滑動至下一個滑動窗口,并返回至從所述待檢測時序數(shù)據(jù)中獲取當前滑動窗口時間段內(nèi)的所有數(shù)據(jù)的步驟;若所述當前滑動窗口周圍的數(shù)據(jù)中不存在不符合所述一維高斯分布模型的數(shù)據(jù),則按照預設滑動步長滑動至下一個滑動窗口,并返回至從所述待檢測時序數(shù)據(jù)中獲取當前滑動窗口時間段內(nèi)的所有數(shù)據(jù)的步驟;
所述利用長周期檢測方法對所述待檢測時序數(shù)據(jù)進行檢測,包括:將當前時刻之前的N個時刻內(nèi)的數(shù)據(jù)按照有監(jiān)督格式輸入至訓練后的SVR模型,以獲得當前時刻下的輸出預測值;獲得所述當前時刻下的輸出預測值和所述當前時刻下的待檢測時序數(shù)據(jù)之間的均方根誤差值;判斷所述均方根誤差值是否大于預設值;若是,則判定所述當前時刻下的所述待檢測時序數(shù)據(jù)屬于異常;否則,判定所述當前時刻下的所述待檢測時序數(shù)據(jù)正常。
2.根據(jù)權(quán)利要求1所述的數(shù)據(jù)質(zhì)量檢測方法,其特征在于,
所述利用所述當前滑動窗口時間段內(nèi)的所有數(shù)據(jù)擬合獲得對應的一維高斯分布模型,包括:
獲得所述當前滑動窗口時間段內(nèi)的所有數(shù)據(jù)對應的均值和標準差;
利用所述均值和標準差獲得所述一維高斯分布模型的概率密度函數(shù);
所述逐個判斷所述當前滑動窗口周圍的數(shù)據(jù)是否符合所述一維高斯分布模型,包括:
利用單樣本K-S校驗檢測方法和所述概率密度函數(shù)逐個判斷當前滑動窗口周圍的數(shù)據(jù)是否符合所述一維高斯分布模型,或者,利用3σ校驗方法和所述概率密度函數(shù)逐個判斷當前滑動窗口周圍的數(shù)據(jù)是否符合所述一維高斯分布模型。
3.根據(jù)權(quán)利要求1所述的數(shù)據(jù)質(zhì)量檢測方法,其特征在于,
所述預設滑動步長小于等于所述當前滑動窗口的大小,所述逐個判斷所述當前滑動窗口周圍的數(shù)據(jù)是否符合所述一維高斯分布模型,包括:
逐個判斷與所述當前滑動窗口相鄰的下一個滑動窗口內(nèi)的非重疊數(shù)據(jù)是否符合所述一維高斯分布模型。
4.根據(jù)權(quán)利要求1所述的數(shù)據(jù)質(zhì)量檢測方法,其特征在于,所述將當前時刻之前的N個時刻內(nèi)的數(shù)據(jù)按照有監(jiān)督格式輸入至訓練后的SVR模型之前,還包括:
獲得所有利用所述短周期檢測方法檢測后的非異常數(shù)據(jù),以形成歷史數(shù)據(jù)集;
將所述歷史數(shù)據(jù)集中的數(shù)據(jù)轉(zhuǎn)化為有監(jiān)督格式,以形成訓練數(shù)據(jù)集,其中,所述訓練數(shù)據(jù)集包括多個時序數(shù)據(jù)子集,以及與各個時序數(shù)據(jù)子集對應的預測值,且任一時序數(shù)據(jù)子集和其對應的預測值屬于所述歷史數(shù)據(jù)集;
將所述訓練數(shù)據(jù)集輸入至初始SVR模型,對所述初始SVR模型進行訓練,以獲得訓練后的SVR模型。
5.根據(jù)權(quán)利要求4所述的數(shù)據(jù)質(zhì)量檢測方法,其特征在于,所述判斷所述當前時刻下的所述待檢測時序數(shù)據(jù)正常,之后,還包括:
將所述當前時刻下的所述待檢測時序數(shù)據(jù)并入所述歷史數(shù)據(jù)集;
利用更新后的歷史數(shù)據(jù)集形成更新后的訓練數(shù)據(jù)集;
利用更新后的訓練數(shù)據(jù)集重新訓練所述SVR模型。
6.根據(jù)權(quán)利要求1所述的數(shù)據(jù)質(zhì)量檢測方法,其特征在于,所述判斷所述當前時刻下的所述待檢測時序數(shù)據(jù)屬于異常后,還包括:
將所述當前時刻下的所述待檢測時序數(shù)據(jù)拆分為多個待檢測子集,每個待檢測子集所包含的周期個數(shù)小于等于所述閾值;
利用所述短周期檢測方法對所述待檢測子集進行檢測。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于浙江大華技術(shù)股份有限公司,未經(jīng)浙江大華技術(shù)股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010680801.2/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





