[發(fā)明專利]一種挖掘時序數(shù)據(jù)故障模式的系統(tǒng)及方法在審
| 申請?zhí)枺?/td> | 201510551484.3 | 申請日: | 2015-09-01 |
| 公開(公告)號: | CN105205111A | 公開(公告)日: | 2015-12-30 |
| 發(fā)明(設(shè)計)人: | 鮑軍鵬;楊天社;樊恒海;齊勇;高宇;王小樂;傅娜;魏強 | 申請(專利權(quán))人: | 西安交通大學;中國西安衛(wèi)星測控中心 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 西安通大專利代理有限責任公司 61200 | 代理人: | 徐文權(quán) |
| 地址: | 710049 *** | 國省代碼: | 陜西;61 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 挖掘 時序 數(shù)據(jù) 故障 模式 系統(tǒng) 方法 | ||
1.一種挖掘時序數(shù)據(jù)故障模式的系統(tǒng),其特征在于,包括:數(shù)據(jù)預(yù)處理模塊、TK-Means聚類模塊、統(tǒng)計學習模塊和DBSCAN聚類模塊;
數(shù)據(jù)預(yù)處理模塊,用于對原始數(shù)據(jù)進行清洗、插值處理,獲得歸一化數(shù)據(jù);
TK-Means聚類模塊,用于對數(shù)據(jù)預(yù)處理模塊處理后的數(shù)據(jù)進行特征向量提取,然后采用TK-means方法對特征向量進行聚類,然后根據(jù)聚類結(jié)果將數(shù)據(jù)轉(zhuǎn)換成特征字符串;
統(tǒng)計學習模塊,用于對特征字符串進行統(tǒng)計學習,找出頻繁模式和非頻繁模式,所述非頻繁模式對應(yīng)著異常模式;
DBSCAN聚類模塊,用于把多個參數(shù)的異常模式聚集在一起形成故障模式。
2.根據(jù)權(quán)利要求1所述的一種挖掘時序數(shù)據(jù)故障模式的系統(tǒng),其特征在于,所述系統(tǒng)還包括故障模式生成模塊;所述故障模式生成模塊,用于把故障模式寫成形式化規(guī)則。
3.根據(jù)權(quán)利要求1所述的一種挖掘時序數(shù)據(jù)故障模式的系統(tǒng),其特征在于,數(shù)據(jù)預(yù)處理模塊包括去野值、生成單參數(shù)文件、等間隔處理以及歸一化處理步驟;去野值的步驟包括:對每個數(shù)據(jù)設(shè)定上下限,把大于上限的數(shù)值變?yōu)樯舷蓿∮谙孪薜臄?shù)值變?yōu)橄孪蓿源巳ヒ爸担坏乳g隔處理處理步驟中,默認對數(shù)據(jù)每隔1秒進行采樣,等間隔處理后的數(shù)據(jù),每分鐘都從0秒開始,59秒結(jié)束;數(shù)據(jù)經(jīng)過等間隔處理之后進行歸一化處理,將其取值范圍轉(zhuǎn)換到[0,1]區(qū)間上。
4.根據(jù)權(quán)利要求1所述的一種挖掘時序數(shù)據(jù)故障模式的系統(tǒng),其特征在于,TK-Means聚類模塊首先對數(shù)據(jù)預(yù)處理模塊處理后的數(shù)據(jù)進行特征向量提取,然后用TK-Means方法對特征向量進行聚類,并將所得聚類結(jié)果的每一個簇表示成一個特征字符;在TK-Means方法中,簇的數(shù)目是一個范圍[min,max];設(shè)置一個最大相似度閾值t*,在聚類開始的時候,隨機選擇一個初始閾值t;如果第一次聚類得到的簇數(shù)目大于max,且t小于最大閾值t*,則將閾值t增大Δt,重新進行聚類,直到第一次聚類得到的簇的數(shù)目在[min,max]范圍中;如果第一次聚類得到的簇的數(shù)目小于min,且閾值t大于Δt,則將閾值t減小Δt,重新進行聚類,直到第一次聚類得到的簇的數(shù)目在[min,max]范圍中;TK-Means聚類的具體過程為:(1)第一次聚類;(2)如果第一次聚類得到的簇的數(shù)目在[min,max]范圍中,則執(zhí)行第(3)步,否則按照調(diào)整閾值t并重復(fù)執(zhí)行第(1)步;(3)聚類并調(diào)整簇心,迭代次數(shù)i遞增;(4)判斷聚類結(jié)果是否穩(wěn)定,如果聚類結(jié)果不穩(wěn)定,則重復(fù)執(zhí)行第(3)步,否則聚類結(jié)束;在第一次聚類中,當簇每增加一條數(shù)據(jù)時,調(diào)整簇中心,直到處理完所有數(shù)據(jù);在第(3)步的聚類過程中,直到所有數(shù)據(jù)全部處理完后,才調(diào)整一次簇心。
5.根據(jù)權(quán)利要求1所述的一種挖掘時序數(shù)據(jù)故障模式的系統(tǒng),其特征在于,統(tǒng)計學習模塊通過尋找頻繁模式的間隙來確定非頻繁模式,即異常模式;正常模式被打斷的地方就是異常模式;正常模式就是頻繁發(fā)生的模式,對應(yīng)特征字符串上的頻繁模式;而異常模式不是頻繁發(fā)生,把特征字符串上的頻繁模式去掉之后,剩下的片段就是非頻繁模式,即潛在異常模式;尋找異常模式的過程為:(1)把特征字符串劃分為一系列長度為L的單詞,并且統(tǒng)計每個單詞的出現(xiàn)頻率;(2)如果一個單詞的出現(xiàn)頻率大于給定閾值,稱作頻繁單詞,否則為非頻繁單詞;(3)連續(xù)取L個字符構(gòu)成當前單詞;如果未達到字符串末尾,則執(zhí)行下一步;否則把當前頻繁模式放入頻繁模式集中,輸出頻繁模式集,然后執(zhí)行第(7)步;(4)判斷當前單詞是否為頻繁單詞;如果是執(zhí)行下一步,否則執(zhí)行第(6)步;(5)向后滑動L個字符并更新當前頻繁模式,然后執(zhí)行第(3)步;(6)向后滑動一個字符,并判斷前一個單詞是否為頻繁單詞;如果是,則更新頻繁模式集,即把當前頻繁模式放入頻繁模式集中;然后執(zhí)行第(3)步;(7)按照起始位置取出頻繁模式集中相鄰的兩個頻繁模式;(8)相鄰頻繁模式的間隙就是非頻繁模式,即潛在異常模式;間隙就是從上一個模式末尾到下一個模式開頭之間的字符串。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于西安交通大學;中國西安衛(wèi)星測控中心,未經(jīng)西安交通大學;中國西安衛(wèi)星測控中心許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510551484.3/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





