[發明專利]一種水文時間序列異常模式檢測方法在審
| 申請號: | 201710092513.3 | 申請日: | 2017-02-21 |
| 公開(公告)號: | CN106951680A | 公開(公告)日: | 2017-07-14 |
| 發明(設計)人: | 王繼民 | 申請(專利權)人: | 河海大學 |
| 主分類號: | G06F19/00 | 分類號: | G06F19/00;G06F17/30 |
| 代理公司: | 南京蘇高專利商標事務所(普通合伙)32204 | 代理人: | 婁嘉寧 |
| 地址: | 210098*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 水文 時間 序列 異常 模式 檢測 方法 | ||
技術領域
本發明屬于數據處理領域,特別涉及一種水文時間序列異常模式檢測方法。
背景技術
水文是指自然界中水的變化、運動等的各種現象,對水文進行研究在水資源開發利用、工程建設管理、農業灌溉、城市用水、航運等方面發揮了重要作用。在對水文進行研究時可以通過發現站點監測的歷年水位數據中的異常變化,從而發現水文過程變化規律。對于歷年水位數據中的異常變化的檢測主要是水文時間序列異常檢測。
時間序列異常檢測主要分成針對時間序列中異常點的檢測和異常模式的檢測。從一般意義上來說,時間序列中一個點的異常,是指在一條時間序列上與其它序列點存在顯著差異的、具有異常特征的序列點;而模式異常是指在這條時間序列上與其它模式存在顯著差異的、具有異常行為的模式。時間序列中的模式一般是指一段具有某種特殊變化過程的子序列。目前已有的各種時間序列異常檢測的方法,包括生物學方法、基于頻率的方法、機器學習方法、基于特征空間的方法等。生物學方法從生物的免疫系統的機制中獲得靈感的將該思想映射到異常檢測上來,這種基于生物學的時間序列異常模式檢測方法的主要缺陷是,當正常的數據變得多種多樣,那么可能產生的正常模式的數目也同樣增加,這會導致產生不出任何用于負選擇過程的異己,最終會使得選擇過程失敗,檢測不出任何異常模式。基于頻率的方法采用后綴樹來編碼時間序列中所有出現的模式,用馬爾科夫模型(Markov model)預測沒有被觀測到的模式期望發生的概率,然后根據用戶給定的閾值來判斷模式的奇異性,即檢測出異常的模式,這樣的方法檢測出的結果不準確。機器學習的方法目前相關研究方法主要包括兩大類:人工神經網絡和支持向量機。基于特征空間的方法一般又分成兩種:(1)一種方法是將時間序列分成等長的子序列,然后將子序列映射為n維空間中的點,然后采用普通數據集合中的異常點檢測方法發現異常。這種方法的一個缺點是序列中的點一般較多,距離的計算和檢測的時間消耗是相當可觀的。(2)另一種方法是從時間序列中抽取特征,然后在特征空間中應用普通數據集合中的異常點檢測方法來發現異常。
發明內容
發明目的:為了克服現有技術中存在的不足,本發明提供了一種準確性高,檢測速度快,運算量小的水文時間序列異常模式檢測方法。
發明內容:為解決上述技術問題,本發明提出一種水文時間序列異常模式檢測方法,包括以下步驟:
步驟1:采集歷年的水位數據,根據時間的順序,以年為單位組成每年的水位時間序列;
步驟2:對每年水位時間序列進行分割,產生水位子序列;
步驟3:水位子序列進行線性分段,形成維度低的水位子序列;主要通過提取主要特征,從而降低維度;
步驟4:對步驟3中獲得的水位子序列進行分組,將同時間段的子序列劃分為一組;
步驟5:在同一組子序列中結合平均變化距離和積累變化距離進行異常子序列的檢測。
進一步,所述步驟2中采用滑動窗口機制對每年水位時間序列進行分割,產生水位子序列。這樣劃分出的子序列是等長的,更易于執行對應時期相同的子序列之間距離的比較計算。
進一步,所述步驟3中通過分析逐段聚集平均的方法對每年的水位時間序列進行線性分段;這樣更加簡單直觀。
進一步,所述步驟5中對異常子序列檢測的方法為,包括以下步驟:
步驟51:根據公式計算組內子序列之間的平均變化距離MC;其中,si表示第i個子序列,n表示子序列的總數,D為子序列之間的距離度量函數;
步驟52:確定si鄰近子序列的個數k,根據公式計算子序列si與近鄰子序列之間的累積變化距離AC;其中,si表示第i個子序列,sNk表示第k個近鄰子序列,wk表示k個鄰近子序列的權值,D為子序列之間的距離度量函數;
步驟53:判斷AC與MC的大小,若AC>MC,則當前子序列si可能為異常子序列,否則視為正常子序列。
進一步,所述子序列之間的距離度量函數采用動態時間序列彎曲距離函數。
進一步,還包括步驟6:將檢測得到的異常子序列采用曲線方式進行圖形展示并進行評估。這樣得到的檢測結果更加的準確并且直觀。
進一步,近鄰子序列的總數k的取值大于3,且小于子序列數量的一半n/2。這樣檢測出的結果更加的準確。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于河海大學,未經河海大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710092513.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種EMAS頂蓋涂覆臺
- 下一篇:瓶蓋加工的放蓋裝置
- 同類專利
- 專利分類
G06F 電數字數據處理
G06F19-00 專門適用于特定應用的數字計算或數據處理的設備或方法
G06F19-10 .生物信息學,即計算分子生物學中的遺傳或蛋白質相關的數據處理方法或系統
G06F19-12 ..用于系統生物學的建模或仿真,例如:概率模型或動態模型,遺傳基因管理網絡,蛋白質交互作用網絡或新陳代謝作用網絡
G06F19-14 ..用于發展或進化的,例如:進化的保存區域決定或進化樹結構
G06F19-16 ..用于分子結構的,例如:結構排序,結構或功能關系,蛋白質折疊,結構域拓撲,用結構數據的藥靶,涉及二維或三維結構的
G06F19-18 ..用于功能性基因組學或蛋白質組學的,例如:基因型–表型關聯,不均衡連接,種群遺傳學,結合位置鑒定,變異發生,基因型或染色體組的注釋,蛋白質相互作用或蛋白質核酸的相互作用





