[發明專利]一種基于空閑歷史信息的計算陣列節能方法無效
| 申請號: | 201010282077.4 | 申請日: | 2010-09-15 |
| 公開(公告)號: | CN101943944A | 公開(公告)日: | 2011-01-12 |
| 發明(設計)人: | 陳海濤;盧宇彤;周恩強;謝旻;曹宏嘉;董勇;蔣艷凰;所光 | 申請(專利權)人: | 中國人民解放軍國防科學技術大學 |
| 主分類號: | G06F1/32 | 分類號: | G06F1/32;G06F9/50 |
| 代理公司: | 國防科技大學專利服務中心 43202 | 代理人: | 郭敏 |
| 地址: | 410073 湖*** | 國省代碼: | 湖南;43 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 空閑 歷史 信息 計算 陣列 節能 方法 | ||
技術領域
本發明涉及高性能計算系統計算陣列的節能方法。
背景技術
隨著高性能計算系統技術的不斷發展,新一代大規模并行計算系統的研制面臨許多新的挑戰。特別是隨著系統性能的不斷提升,規模越來越龐大,系統的能耗飛速增長,造成了大規模計算系統的能耗危機。系統能耗和系統性能的比值正成為高性能計算的主要評價指標之一。
高性能計算系統通常包括前端服務陣列、計算陣列、后端存儲陣列三個組成部分。計算陣列由大量的計算結點組成,對外提供作業的執行服務。計算陣列作為高性能計算陣列的主要能耗部件,是能耗優化研究和工程設計的重點。目前常見的計算陣列節能方法包括:
1)限制可用結點數量的節能方法。根據計算系統的歷史平均利用率P,關閉計算陣列中百分比為(1-P)的計算結點,達到節能的目的。該方法會增加作業的平均等待時間,降低用戶滿意度。此外該方法不能適應系統利用率頻繁變化的用戶環境。
2)定時休眠空閑結點的節能方法。管理員手工設定一個時間參數T。當計算結點空閑時間達到T后,將空閑結點置于S3休眠狀態。S3休眠狀態是ACPI(Advanced?Configuration?and?Power?Interface?Specification)標準定義的計算系統的一種低功耗狀態,相比開機狀態能夠節省90%-95%的能耗。廣泛應用的slurm高性能資源管理系統即采用該手工設定時間參數T的節能方法。如果T參數的設定時間過短,則計算結點可能剛進入休眠狀態,很快又被分配作業然后被喚醒,導致計算結點狀態切換頻繁,影響系統穩定性。如果T參數的設定時間過長,則計算結點空閑很長時間后才進入休眠狀態,影響節能效果。
當前絕大多數計算結點生產廠商和通用操作系統均支持ACPI標準規定的S3休眠狀態,為基于S3休眠狀態的節能方法提供了支持。由于用戶作業提交的不均衡特性和作業調度策略的部分保序特性,計算陣列運行過程中存在大量的空閑計算結點。如何對這些空閑的計算結點進行節能設計,是本領域技術人員極為關注的技術問題。
發明內容
本發明要解決的技術問題在于:針對高性能計算系統計算陣列的節能問題,提出一種基于空閑歷史信息的計算結點節能方法,利用結點空閑時間的歷史記錄動態自適應地控制計算結點進入S3休眠狀態,達到較好的節能效果,同時維持結點的能耗狀態切換次數在一個可控的低水平。
為了解決上述技術問題,本發明的技術方案為:為每個計算結點建立一個獨立的空閑歷史信息隊列,根據空閑歷史信息隊列對每個計算結點的能耗狀態進行獨立控制。每當計算結點上作業被釋放時,結合管理員配置的結點能耗狀態切換次數限制和空閑歷史信息隊列設定空閑結點進入S3休眠狀態的時間點。結點從空閑狀態切換到S3休眠狀態、S3休眠狀態切換到開機狀態均算一次能耗狀態切換。每當該計算結點從空閑狀態加載作業或者S3休眠狀態被重新喚醒然后加載作業時,將該次空閑的開始時間和空閑時間長度加入空閑歷史信息隊列。根據大量高性能計算系統的運行數據統計,結點的空閑時間長度具有相似性,根據結點的空閑歷史規律預測結點未來的空閑時間長度具有較高的準確度,這奠定了本發明的理論基礎。
具體技術方案為:?
第一步,構造計算陣列節能系統。計算陣列節能系統是部署在高性能計算系統前端服務陣列中的服務器上的軟件包,由能耗狀態調節模塊和能耗狀態控制模塊組成。能耗狀態調節模塊是節能優化決策模塊,構造計算結點的空閑歷史信息隊列,根據空閑歷史信息設定計算結點進入S3休眠狀態的時間點,將計算結點休眠的時間點傳遞給能耗控制模塊。能耗狀態控制模塊是節能優化實施模塊,負責根據能耗狀態調節模塊指定的時間點將空閑計算結點置于S3休眠狀態,在已休眠計算結點被分配作業后喚醒計算結點。
第二步,設定節能參數:歷史信息隊列的時間窗口HISTORY_WINDOW(單位為秒),其取值范圍為7天到1個月,其取值決定了歷史信息隊列中保存的記錄的時間約束;計算結點一天中允許能耗狀態切換的次數SWITCHS_LIMIT,其取值范圍為2到10次;結點從空閑狀態進入S3休眠狀態的最短時間限制MINI_SUSPEND_TIME,其取值范圍為1到5分鐘,避免過于頻繁的結點能耗狀態切換。
第三步,能耗狀態調節模塊構造空閑歷史信息隊列,根據空閑歷史信息設定計算結點進入S3休眠狀態的時間點。方法是:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國人民解放軍國防科學技術大學,未經中國人民解放軍國防科學技術大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010282077.4/2.html,轉載請聲明來源鉆瓜專利網。
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置





