[發明專利]一種基于資源解耦的大數據系統性能評估方法在審
| 申請號: | 201710542422.5 | 申請日: | 2017-07-05 |
| 公開(公告)號: | CN107346281A | 公開(公告)日: | 2017-11-14 |
| 發明(設計)人: | 孟小峰;楊晨 | 申請(專利權)人: | 中國人民大學 |
| 主分類號: | G06F11/34 | 分類號: | G06F11/34 |
| 代理公司: | 北京紀凱知識產權代理有限公司11245 | 代理人: | 徐寧,孫楠 |
| 地址: | 100872 北京市海淀*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 資源 數據 系統 性能 評估 方法 | ||
技術領域
本發明涉及一種大數據系統性能評估方法,特別是關于一種基于資源解耦的大數據系統性能評估方法。
背景技術
以往工作已經廣泛地研究了如何量化大數據系統的部件影響,包括兩個分支。一些工作是量化軟件框架部件的影響以分析時間開銷。MapReduce和Spark中主要組成部分的性能比較為源代碼添加了定時器來提供執行時間分解,并分析了隨機訪問,執行模型和緩存的性能。Hadoop的基于成本的性能模型通過描述細粒度的執行來預測MapReduce作業的性能,而Starfish可以使用自調節系統。
其他工作就是量化硬件資源的影響來分析哪個部件是瓶頸.R的運行時間配置將收集計數器添加到R源代碼中,分析處理器和內存使用特性。Spark的阻塞時間分析方法消除了磁盤和網絡I/O,以便在磁盤或網絡無限快的情況下獲得兩個最大加速。
大數據系統的性能總是受到CPU、內存、磁盤和網絡的影響,為了量化這些部件對性能的影響,進行系統瓶頸分析非常重要。但是最先進的部件耦合方法卻只能某些部件的影響,如磁盤和網絡,并且結果還容易出錯。
發明內容
針對上述問題,本發明的目的是提供一種基于資源解耦的大數據系統性能評估方法,該方法能動態解耦CPU,內存,磁盤和網絡四大部件,能確保定量影響因素之間相互比較,量化了密集度。
為實現上述目的,本發明采取以下技術方案:一種基于資源解耦的大數據系統性能評估方法,其特征在于包括以下步驟:1)形式化不同的硬件集合:假設當前集群下,CF={c1,c2,…,cl}為同一處理器的不同頻率升序集合,并選取最小值c1作為參考頻率,即提高CPU頻率查詢所獲得的性能提升是相對于c1頻率的,cl為該處理器最大CPU頻率,l為CF集合可選的CPU頻率個數;同理定義DB={d1,d2,…,dm}為可選的硬盤集合,其中d1作為參考,dm為最大硬盤帶寬,m為DB集合可選的硬盤帶寬個數;NB={n1,n2,…,nz}為可選的網絡集合,其中n1作為參考,nz為最大網絡帶寬,z為NB集合可選的網絡帶寬個數;2)定義CPU、硬盤和網絡升級后所帶來的加速;3)根據CPU、硬盤和網絡升級后所帶來的加速確定各自量化瓶頸,即確定各自密集度模型,通過密集度模型評估各自的密集度,完成大數據系統性能評估。
進一步,所述步驟2)中,定義Runtime(c,d,n)為某查詢在指定硬件配置下的運行時間,若CPU頻率提升到ci且其他部件保持不變,那么查詢所獲得的CPU加速CS為:
其中,CS∈[0,1),且CS越接近1代表查詢性能提升越高。
進一步,所述步驟2)中,定義Runtime(c,d,n)為某查詢在指定硬件配置下的運行時間,如果僅升級硬盤到dj,定義升級硬盤后查詢所獲得的加速DS為:
其中,DS∈[0,1)。
進一步,所述步驟2)中,定義Runtime(c,d,n)為某查詢在指定硬件配置下的運行時間,僅升級網絡到nk,定義更快的網絡使查詢所獲得的加速NS為:
其中,NS∈[0,1)。
進一步,通過CPU升級后所帶來的加速CS定義CPU量化瓶頸CID為:
其中,l為可選的CPU頻率個數,且CID∈[0,1],d為一種任意的硬盤帶寬環境,n為一種任意的網絡帶寬環境;對于頻率ci,如果CS(ci,d,n)=1-c1/ci,則CID=1代表查詢為完全計算密集的;相反,如果CS(ci,d,n)=0,則CID=0代表升級CPU對查詢的性能的提高無效,此時查詢為完全非計算密集的。
進一步,在當前集群環境下,量化硬盤瓶頸DID為:
其中,m是可選硬盤的個數,如CID性質一致則DID∈[0,1],硬盤瓶頸越高,DID越趨近于1,反之亦然。
進一步,當前集群環境下,網絡瓶頸NID為:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國人民大學,未經中國人民大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710542422.5/2.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





