[發(fā)明專(zhuān)利]基于隨機(jī)森林回歸的虛擬機(jī)性能預(yù)測(cè)方法有效
| 申請(qǐng)?zhí)枺?/td> | 201710075720.8 | 申請(qǐng)日: | 2017-02-13 |
| 公開(kāi)(公告)號(hào): | CN106897109B | 公開(kāi)(公告)日: | 2020-04-14 |
| 發(fā)明(設(shè)計(jì))人: | 王娟;張彬彬;岳昆;郝佳;武浩 | 申請(qǐng)(專(zhuān)利權(quán))人: | 云南大學(xué) |
| 主分類(lèi)號(hào): | G06F9/455 | 分類(lèi)號(hào): | G06F9/455 |
| 代理公司: | 成都行之專(zhuān)利代理事務(wù)所(普通合伙) 51220 | 代理人: | 溫利平;陳靚靚 |
| 地址: | 650091*** | 國(guó)省代碼: | 云南;53 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 隨機(jī) 森林 回歸 虛擬機(jī) 性能 預(yù)測(cè) 方法 | ||
1.一種基于隨機(jī)森林回歸的虛擬機(jī)性能預(yù)測(cè)方法,其特征在于,包括以下步驟:
S1:根據(jù)待預(yù)測(cè)的虛擬化環(huán)境的資源特點(diǎn),從底層硬件特征、虛擬機(jī)軟件特征、虛擬機(jī)資源配置特征、虛擬機(jī)運(yùn)行時(shí)環(huán)境特征四個(gè)方面提取可能影響虛擬機(jī)性能的特征,記所提取到的虛擬機(jī)性能特征數(shù)量為F;
S2:根據(jù)步驟S1中各虛擬機(jī)性能特征的可能取值,配置得到一組不同虛擬機(jī)性能特征組合的虛擬機(jī),記虛擬機(jī)數(shù)量為N;根據(jù)虛擬機(jī)上待運(yùn)行的應(yīng)用類(lèi)型選取一組基準(zhǔn)測(cè)試程序,分別在每一臺(tái)虛擬機(jī)上運(yùn)行基準(zhǔn)測(cè)試程序,記錄預(yù)設(shè)的性能指標(biāo)的數(shù)值,得到由N臺(tái)虛擬機(jī)的數(shù)據(jù)Dn=(Xn,Yn)構(gòu)成的數(shù)據(jù)樣本集D,其中Xn=(xn,1,xn,2,…,xn,F)表示第n臺(tái)虛擬機(jī)的虛擬機(jī)性能特征,xn,i表示第n臺(tái)虛擬機(jī)中第i個(gè)虛擬機(jī)性能特征xi的取值,Yn表示第n臺(tái)虛擬機(jī)Xn對(duì)應(yīng)的性能指標(biāo)值,i=1,2,…,F,n=1,2,…,N;
S3:根據(jù)步驟S2得到的數(shù)據(jù)樣本集D構(gòu)建隨機(jī)森林回歸模型,其具體方法為:
S3.1:令決策樹(shù)序號(hào)t=1;
S3.2:從步驟S2得到的數(shù)據(jù)樣本集D中,采用Bootstrap方法有放回地多次隨機(jī)采樣,抽取γ×N個(gè)數(shù)據(jù)樣本作為第t棵決策樹(shù)的訓(xùn)練集S(t),γ的取值范圍為0<γ≤1;
S3.3:令決策樹(shù)深度d=1,將S(t)作為根節(jié)點(diǎn)的樣本集合,根節(jié)點(diǎn)對(duì)應(yīng)的性能指標(biāo)值為根節(jié)點(diǎn)樣本集合中所有樣本的性能指標(biāo)平均值;
S3.4:如果第t棵決策樹(shù)的深度d=Td,Td表示決策樹(shù)深度最大值,本決策樹(shù)訓(xùn)練完畢,進(jìn)入步驟S3.8,否則進(jìn)入步驟S3.5;
S3.5:對(duì)第d層的每個(gè)節(jié)點(diǎn),依次按照以下方法進(jìn)行節(jié)點(diǎn)切分:
記節(jié)點(diǎn)的樣本集合為S,如果樣本集合中的樣本數(shù)目小于預(yù)設(shè)閾值TS,則本節(jié)點(diǎn)作為葉子節(jié)點(diǎn),不再切分,否則從F維虛擬機(jī)性能特征中無(wú)放回地隨機(jī)選取f維特征構(gòu)成集合P,f的取值范圍為1≤f≤F;對(duì)于虛擬機(jī)性能特征集合P中的每個(gè)特征xj,分別選取K個(gè)切分點(diǎn)λj(k),k=1,2,…,K,K表示切分點(diǎn)數(shù)量;根據(jù)如下公式計(jì)算出節(jié)點(diǎn)樣本集合S中以特征xj和切分點(diǎn)λj(k)進(jìn)行切分時(shí)的加權(quán)方差M(j,k):
其中,R1(j,k)表示節(jié)點(diǎn)樣本集合S中切分特征xj的取值小于等于λj(k)的樣本集合,R2(j,k)表示節(jié)點(diǎn)樣本集合S中切分特征xj的取值大于λj(k)的樣本集合,Q1和Q2分別表示R1(j,k)和R2(j,k)中樣本數(shù)量,c1和c2分別表示R1(j,k)和R2(j,k)中所有樣本的性能指標(biāo)平均值;
篩選出最小加權(quán)方差,如果最小加權(quán)方差小于設(shè)定的最小切分閾值Tλ,則本節(jié)點(diǎn)作為葉子節(jié)點(diǎn),不再切分,否則選擇最小加權(quán)方差對(duì)應(yīng)的特征和切分點(diǎn)作為本節(jié)點(diǎn)的切分特征和切分點(diǎn),將節(jié)點(diǎn)樣本集合S中切分特征的取值小于等于的樣本劃分至左子節(jié)點(diǎn),大于的樣本劃分至右子節(jié)點(diǎn),子節(jié)點(diǎn)對(duì)應(yīng)的性能指標(biāo)值為子節(jié)點(diǎn)樣本集合中所有樣本的性能指標(biāo)平均值;
S3.6:如果第d層的每個(gè)節(jié)點(diǎn)均為葉子節(jié)點(diǎn),本決策樹(shù)訓(xùn)練完畢,進(jìn)入步驟S3.8,否則進(jìn)入步驟S3.7;
S3.7:令d=d+1,返回步驟S3.4;
S3.8:如果t<Tt,Tt表示隨機(jī)森林回歸模型中決策樹(shù)的數(shù)量,進(jìn)入步驟S3.9,否則隨機(jī)森林回歸模型構(gòu)建完畢;
S3.9:令t=t+1,返回步驟S3.2;
S4:對(duì)于待預(yù)測(cè)性能的虛擬機(jī)X′=(x′1,x′2,…,x′F),分別采用隨機(jī)森林回歸模型中的Tt個(gè)決策樹(shù)預(yù)測(cè)得到Tt個(gè)性能預(yù)測(cè)值,平均后得到該虛擬機(jī)的性能預(yù)測(cè)值,每個(gè)決策樹(shù)預(yù)測(cè)的方法為:將虛擬機(jī)X′的性能特征矢量(x′1,x′2,…,x′F)輸入決策樹(shù)的根節(jié)點(diǎn),根據(jù)該節(jié)點(diǎn)的切分特征和切分點(diǎn)將虛擬機(jī)X′劃分入相應(yīng)子節(jié)點(diǎn),以此類(lèi)推直到到達(dá)某個(gè)葉子節(jié)點(diǎn),以該葉子節(jié)點(diǎn)對(duì)應(yīng)的性能指標(biāo)值作為采用該決策樹(shù)得到的性能預(yù)測(cè)值。
2.根據(jù)權(quán)利要求1所述的虛擬機(jī)性能預(yù)測(cè)方法,其特征在于,所述步驟S3.5中最小切分閾值Tλ的取值范圍為T(mén)λ≤0.01。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于云南大學(xué),未經(jīng)云南大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710075720.8/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
- 隨機(jī)數(shù)生成設(shè)備及控制方法、存儲(chǔ)器存取控制設(shè)備及通信設(shè)備
- 隨機(jī)接入方法、用戶設(shè)備、基站及系統(tǒng)
- 真隨機(jī)數(shù)檢測(cè)裝置及方法
- 隨機(jī)元素生成方法及隨機(jī)元素生成裝置
- 數(shù)據(jù)交互方法、裝置、服務(wù)器和電子設(shè)備
- 一種隨機(jī)數(shù)發(fā)生器的多隨機(jī)源管理方法
- 用于彩票行業(yè)的隨機(jī)數(shù)獲取方法及系統(tǒng)
- 隨機(jī)接入方法、裝置及存儲(chǔ)介質(zhì)
- 偽隨機(jī)方法、系統(tǒng)、移動(dòng)終端及存儲(chǔ)介質(zhì)
- 模型訓(xùn)練方法、裝置和計(jì)算設(shè)備
- 基于KNN的置信回歸算法及裝置
- 自動(dòng)行走設(shè)備的路徑回歸方法、自動(dòng)行走設(shè)備及路徑回歸系統(tǒng)
- 一種基于特征選擇和集成學(xué)習(xí)的軟件缺陷個(gè)數(shù)預(yù)測(cè)方法
- 一種基于集成正交成分最優(yōu)化回歸分析的軟測(cè)量方法
- 廣告場(chǎng)景的回歸測(cè)試方法、裝置及系統(tǒng)
- 回歸測(cè)試方法及裝置
- 正則化線性回歸生成方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 一種精確預(yù)測(cè)隧道圍巖位移的方法
- 多環(huán)境協(xié)同回歸方法、裝置、設(shè)備、存儲(chǔ)介質(zhì)
- 回歸測(cè)試方法及裝置





