[發明專利]一種基于云端大數據遷移和處理成本的優化算法在審
| 申請號: | 201710445796.5 | 申請日: | 2017-06-14 |
| 公開(公告)號: | CN107273184A | 公開(公告)日: | 2017-10-20 |
| 發明(設計)人: | 夏輝;王曉薇;范書國 | 申請(專利權)人: | 沈陽師范大學 |
| 主分類號: | G06F9/455 | 分類號: | G06F9/455;G06F9/48;H04L29/08 |
| 代理公司: | 沈陽維特專利商標事務所(普通合伙)21229 | 代理人: | 陳福昌 |
| 地址: | 110034 遼寧省沈*** | 國省代碼: | 遼寧;21 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 云端 數據 遷移 處理 成本 優化 算法 | ||
1.一種基于云端大數據遷移和處理成本的優化算法,其特征在于,包括如下步驟:
(1)定義是從數據源r∈R傳輸1GB數據到數據中心d∈D的價格,那么t時刻的帶寬總費用可定義為:
(2)假設sd為單時隙內數據中心d∈D上儲存1GB數據所需要的成本,則t時刻系統產生的存儲數據的總成本為:
(3)定義為t時刻從數據中心d中租用的k類型虛擬機數量,令為t時刻數據中心d中k類型的虛擬機的價格,則數據處理所需要的計算成本為:
(4)假設為數據源r∈R傳輸數據到數據中心d∈D的延遲,α為將延遲轉換為經濟成本的權重系數,則延遲轉換的計算成本為:
基于以上的成本公式,可以得到系統中產生的總成本為:
C(t)=Cp(t)+Cs(t)+Cb(t)+Cl(t) (5)
假設ar(t)為t時刻數據源r生成的數據量,由于從任意數據源生成的數據可移動到任意數據中心進行處理,設為在t時刻從數據源r移動到數據中心d的數據量,為數據源r產生的最大數據量;則有:
根據上面的定義和假設,最小化時間段[0,T]內數據遷移和處理的時間平均成本可以形式化為:
從問題P1表達來看,由于數據生成是未知且動態的,資源變量是整數型,因此以上問題是一個約束隨機整數優化問題;其中約束(10)是為了確保在單時隙內分配給各數據中心數據的總和等于在該時刻產生的總數據量.約束(11)確保了所需的虛擬機數量不超過數據中心可以提供的圍.
(5)利用李雅普諾夫優化框架理論設計在線控制算法
令Hd(t)為時間序列上數據中心d中未處理的數據量,首先,定義Hd(0)=0,則隊列Hd(t)的演化可以描述如下:
上述隊列的更新規則意味著所處理的數據量為新到達的數據量為為了保證隊列Hd(t),在最壞情況下的延遲處于最大工作負載延遲l內,設計了一個相關虛擬隊列Zd(t),其中,虛擬隊列Zd(t)的負載初始化為Zd(0)=0,且更新如下規則:
其中指示函數表示當Hd(t)>0時等于1,否則等于0;同樣地,表示當Hd(t)=0時為1,否則為0;εd為預設常數,用來控制隊列延遲的范圍。由此可以證明,若所提算法能夠保證隊列Hd(t)和Zd(t)在長時間的穩定,則所有數據都可以在至多l個時隙延遲內得到處理.并且,l可設置為其中和分別是隊列Hd(t)和Zd(t)的上限;
令Z(t)=(Zd(t)),H(t)=(Hd(t)),分別表示虛擬隊列和實際隊列的矩陣,則可以用θ(t)=[H(t),Z(t)]來表示實際隊列和虛擬隊列的聯合矩陣;據李雅普諾夫框架,定義李雅普諾夫函數如下:
其中L(θ(t))為系統中負載積壓的度量。則單時隙的李雅普諾夫漂移函數則可定義為:
Δ(θ(t))=E{L(θ(t+1))L(θ(t))|θ(t)}(16)
為在保證系統隊列穩定的同時還最小化系統所產生的花費,則李雅普諾夫漂移-懲罰項可以在上式(16)漂移函數中增加系統總成本函數獲得,即:
Δ(θ(t))+V·E{C(t)|θ(t)}(17)
其中V為非負參數,它可以在系統穩定性和成本之間進行折衷.V越大,系統產生的成本就越小,反之成本就越大.因此,原來的問題P1就變成了下面的問題P2:
P2.min(17)(18)
s.t.:(9)(10)(11)(12)(19)
求解P2的關鍵是找到其上界,通過推導可證明,式子(17)的界為:
其中
通過仔細研究不等式(20)右邊,將優化問題等價地分解成兩個子問題:即數據分配問題和資源供應問題;
(6)求解以上兩個子問題的細節如下所述:
a、數據遷移:為最小化式(20)右邊,其中與數據遷移相關的部分可被提取為:
此外,由于各數據源的數據是獨立生成的,式子(21)所述的多數據源整體優化方式可以分別在各數據源獨立執行,考慮t時刻數據源r上數據分配,則所述數據遷移問題轉化為解決如下問題:
該問題是一個廣義的最小權重問題,從數據源r遷移到數據中心d的權重為它與數據積壓Hd(t),帶寬成本儲存成本sd,延遲成本有關,通過使用線性規劃理論,我們可以求得以下解決方案:
其中顯然,t時刻算法傾向于將數據源r產生的數據遷移至該時刻具有最短任務隊列和最小運行成本的數據中心進行處理。
b、資源配置:如去掉式子(20)右邊的常數項B,則變量相關的部分可以被認為是資源供應問題,通過解決如下問題得到虛擬機最優供應策略:
同理,由于各數據中心中的資源供給是獨立的,與數據分配問題相似,式子(23)可以在每個數據中心建分布地求解,因而,對于單個數據中心d,資源供應問題可以進一步改寫為:
易得上述線性問題的解為:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于沈陽師范大學,未經沈陽師范大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710445796.5/1.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





