[發明專利]一種基于多任務學習時間序列的云平臺工作負載預測方法有效

申請號：	202011396557.3	申請日：	2020-12-03
公開（公告）號：	CN112486687B	公開（公告）日：	2022-09-27
發明（設計）人：	王進;馬夢涵;李辰宇;徐其成;舒雅寧;彭浩;孫開偉;劉彬	申請（專利權）人：	重慶郵電大學
主分類號：	G06F9/50	分類號：	G06F9/50;G06F11/30;G06N3/04;G06N3/08
代理公司：	重慶輝騰律師事務所 50215	代理人：	王海軍
地址：	400065 重***	國省代碼：	重慶;50
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	一種基于任務學習時間序列平臺工作負載預測方法
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【權利要求書】：

1.一種基于多任務學習時間序列的云平臺工作負載預測方法，其特征在于，包括以下步驟：

獲取工作負載數據，并對獲取的數據進行預處理，工作負載數據至少包括隊列類型、隊列狀態、磁盤類型、CPU利用率、內存利用率、作業數；

采用滑動窗口的方法劃分數據，將當前時刻前24個小時劃分為144個時間間隔，并用其預測當前時刻之后10個時間間隔的平均工作負載；

對劃分的每個時間間隔的數據構建基礎特征、交叉特征、時序趨勢特征、用戶行為關聯特征，并采用二維SHAP進行特征選擇；其中用戶行為關聯特征的獲取過程包括：

對于Q個隊列，每個隊列對應R個用戶、每個用戶對應N個作業，其中，R在{1,2,3,…r}中取值，N在{1,2,3,…n}中取值；

對于處在不同隊列的同一用戶，在24小時內計算所有用戶在不同隊列的提交作業的時間間隔和申請的作業的總資源數量，求的每個用戶的平均負載資源利用率作為權重W_j，計算每個隊列每個用戶的貢獻值作為標簽，每個隊列的屬性作為特征，傳入LightGBM回歸模型中得到用戶在每個隊列的關聯度概率情況，將該關聯度概率作為用戶行為關聯特征；

每個隊列每個用戶的貢獻值表示為：

其中，R_j為第j個時刻的CPU利用率、內存利用率的線性加權；∈_j為R_j的偏置；

將選擇的特征輸入傳入TCN-LSTM模型中，采用多任務學習的方式，共有三個任務，分別為：預測T時間段的CPU平均利用率、預測T時間段的正在運行的作業數、預測T時間段的平均內存利用率，T在{1,2,3,…t}中取值；多任務學習過程包括以下步驟：

將工作負載作為三元組w＝C_d,t,J_d,t,M_d,t，其中C_d,t表示d天t時段的CPU平均利用率，J_d,t表示d天t時段的正在運行的作業數，M_d,t表示d天t時段的內存平均利用率；

在TCN-LSTM模型后接入三個全連接網絡預測三個任務，分別為Task A：預測d天T時間后的10個時間間隔的平均CPU利用率C_d,t,C_d,t+1,C_d,t+2,……C_d,t+9、Task B：預測d天T時間后的10個時間間隔的運行的作業數J_d,t,J_d,t+1,J_d,t+2,……J_d,t+9、Task C：預測d天T時間后的10個時間間隔的平均內存利用率M_d,t,M_d,t+1,M_d,t+2,……M_d,t+9；