[發明專利]基于模式融合的CPU負載多步預測方法在審
| 申請號: | 201410183205.8 | 申請日: | 2014-05-04 |
| 公開(公告)號: | CN104021045A | 公開(公告)日: | 2014-09-03 |
| 發明(設計)人: | 曹健;楊定裕;顧驊;沈琪駿;王烺 | 申請(專利權)人: | 上海交通大學 |
| 主分類號: | G06F9/50 | 分類號: | G06F9/50 |
| 代理公司: | 上海漢聲知識產權代理有限公司 31236 | 代理人: | 胡晶 |
| 地址: | 200240 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 模式 融合 cpu 負載 預測 方法 | ||
技術領域
本發明涉及服務器CPU負載預測技術領域,具體涉及一種基于模式融合的CPU負載多步預測方法。
背景技術
在分布式系統中,可用的資源是隨時間變化的,同時調度系統也需要做出相應的變化。由于地理上的分布情況,在現實中監控和采集資源的數據分布存在延遲,難以實時的獲取當前的可用資源,因此通過性能預測能夠方便資源管理與調度。
CPU負載的監控與預測是應用程序的成功運行的必要條件,CPU負載能夠顯示機器的性能狀態。如果CPU負載過高,服務器的性能將會嚴重降低。高負荷的CPU負載的服務器異常狀態會引起系統崩潰,有效地監控與預測CPU負載可以幫助管理員采取相應的對策,如關閉或重啟應用程序,升級硬件等。
以往的研究證明CPU負載可以記錄成一個時間序列數據,通過時間序列預測算法對CPU負載進行預測,但是這些模型不能有效的支持多步預測。多步預測比單步預測更具有挑戰性,也更有意義。多步預測能夠知道將來更長時間內CPU負載的趨勢,能夠給管理員和調度系統足夠的時間去處理異常事件。
現有的多步預測方法是基于迭代單步預測,這種方法對步數較少的預測比較適用,但是如果步數較大,會出現預測結果偏移越來越大的問題。如前面幾步預測結果已經出現誤差,那么后面的預測將難以估計準確值。
近年來,在預測過程中,基于模式匹配的方式也有流行,它們是通過計算模式與模式之間的歐幾里得距離來度量數據之間相似性。這種匹配方式過于擬合,無法估計模式的方向性或者趨勢性,存在一定匹配誤差,無法準確估計預測結果。
發明內容
本發明的目的在于提供一種基于模式融合的CPU負載多步預測方法,本發明提供了對服務器CPU負載進行長期預測的方法,該方法預測精度高,具有準確性高、可靠性高的優點。
為達到上述目的,本發明提供一種基于模式融合的CPU負載多步預測方法,包括以下步驟:
步驟1:模式抽取
把一個時間序列數據切分成多個數據模式的集合,并統計各個數據模式的個數;
步驟2:模式過濾
經過步驟1得到所有的模式與個數,過濾一些不常出現的模式,對這些模式統計,根據個數從大到小進行排序,給定一個過濾因子α,使過濾后的模式能夠覆蓋大部分模式;
步驟3:模式融合、匹配
對于一些模式相差不大的模式,合并成一些通用的趨勢模式,并根據這些通用的趨勢模式進行匹配,在匹配過程中,采用漢明距離來度量模式與模式之間的方向距離,然后使用歐幾里得距離來度量實際距離;
步驟4:模式加權預測
經過步驟3找到一些近似模式后,采用平均規則策略或均勻下降策略根據這些模式的后面的值來進行多步預測;
步驟5:預測結果融合
采用多個模式長度來指導預測,并根據每個模式長度的預測值進行融合,采用機器學習Adaboost算法進行合成,得到最終結果。
依照本發明較佳實施例所述的基于模式融合的CPU負載多步預測方法,步驟1中:
時間序列數據是一系列數據x1,x2,x3,…,xn,這些數據之間存在有序性;
數據模式是給定一個時間序列數據,從時間序列數據中找打一個子序列Cp=xp,xp+1,…,xp+w-1,這個子序列在歷史數據中經常出現。
依照本發明較佳實施例所述的基于模式融合的CPU負載多步預測方法,步驟2中,過濾因子α滿足以下條件:
其中,Qi是一個長度為i的模式集合;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海交通大學,未經上海交通大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410183205.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:配電網單相接地故障定位方法
- 下一篇:一種燈絲LED燈泡





