[發(fā)明專利]一種多核處理器集群任務(wù)資源分配方法無效
| 申請?zhí)枺?/td> | 201010247472.9 | 申請日: | 2010-08-06 |
| 公開(公告)號: | CN101916209A | 公開(公告)日: | 2010-12-15 |
| 發(fā)明(設(shè)計)人: | 柴亞輝;熊李艷;胡林峰;劉覺夫;謝昕;劉建輝 | 申請(專利權(quán))人: | 華東交通大學(xué) |
| 主分類號: | G06F9/50 | 分類號: | G06F9/50;G06F1/20 |
| 代理公司: | 南昌市平凡知識產(chǎn)權(quán)代理事務(wù)所 36122 | 代理人: | 姚伯川 |
| 地址: | 330013 *** | 國省代碼: | 江西;36 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 多核 處理器 集群 任務(wù) 資源 分配 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及一種多核處理器集群任務(wù)資源分配方法,屬于高性能計算與計算機集群技術(shù)領(lǐng)域。
背景技術(shù)
隨著集成電路進入深亞微米及納米工藝后,多核處理器的設(shè)計面臨著一系列新的問題,而功耗就是其中至關(guān)重要的一方面。處理器的功耗不但在很大程度上影響著芯片的封裝、測試以及系統(tǒng)可靠性等,還在很大程度上決定著片上系統(tǒng)和移動設(shè)備的發(fā)展,CPU產(chǎn)生的熱量已經(jīng)開始嚴(yán)重影響到CPU頻率的提升。
在由多核處理器為計算節(jié)點構(gòu)成的集群系統(tǒng)上,散熱的問題一直是一個很大的問題。傳統(tǒng)的散熱技術(shù)主要有CPU風(fēng)扇、空調(diào)、液體制冷技術(shù)等。其實,我們在使用集群系統(tǒng)時,任務(wù)資源分配策略的好壞,對功耗以及集群系統(tǒng)的散熱也會產(chǎn)生很大的影響。隨著在CPU上集成的計算核的數(shù)目越來越多,由雙核到4核、8核甚至眾核,計算機的各個核在高負(fù)荷運行時,會產(chǎn)生比空閑狀態(tài)時多出好多的熱量。在集群的體系架構(gòu)中,每個機柜中緊密存放了多臺刀片式多核服務(wù)器作為計算節(jié)點。如果這些計算節(jié)點同時滿負(fù)荷運行,則產(chǎn)生的熱量會使CPU的溫度快速升高,甚至?xí)霈F(xiàn)過熱的現(xiàn)象,會影響到集群的系統(tǒng)性能,有時會迫使集群管理系統(tǒng)對某溫度過高的計算節(jié)點進行強行關(guān)機,以保護CPU。
對于多核處理器使用與管理,已有一些公開的報道。公開號CN101403982公開了一種多核處理器的任務(wù)分配方法、系統(tǒng)及設(shè)備,任務(wù)分配器根據(jù)狀態(tài)寄存器的狀態(tài)判斷處理器內(nèi)核是否空閑;任務(wù)分配器通過傳輸通道向空閑的處理器內(nèi)核傳輸消息包。公開號101464813公開了一種用于多核處理器上的自動工作量分配的系統(tǒng)和方法。公開號CN101114186公開了一種用于控制多核心處理器中發(fā)熱的方法和設(shè)備。公開號101010655公開了一種協(xié)調(diào)多核處理器中的空閑狀態(tài)轉(zhuǎn)換的方法,用于在具有多個核心的處理器的核心檢測命令,其中該命令請求該核心轉(zhuǎn)換到空閑狀態(tài)。根據(jù)該命令和多核的每一個的空閑狀態(tài)情況來管理該核心的功率消耗。
本發(fā)明提出了一個與上述方法不同的任務(wù)資源分配方法,在對集群上運行的任務(wù)根據(jù)物理位置均勻分配所需要資源,有效地防止作業(yè)過分集中在某一區(qū)域而引起局部計算節(jié)點溫度過熱的現(xiàn)象。
發(fā)明內(nèi)容
本發(fā)明的目的是,為了有效地防止多核處理器作業(yè)過分集中在某一區(qū)域,造成集群資源利用不均衡,同時因多核處理器的功耗問題,造成計算機產(chǎn)生的大量熱量不能及時散發(fā)的問題。本發(fā)明提出一種基于計算節(jié)點均勻定位的任務(wù)資源分配器,使得在多核處理器集群上所運行的任務(wù)能夠均勻地分布在該集群的資源節(jié)點上。
本發(fā)明解決其技術(shù)問題所采用的技術(shù)方案是:所述方法根據(jù)用戶所提交到該集群上的作業(yè)任務(wù),以CPU為基本分配單元,進行任務(wù)分配,構(gòu)成任務(wù)資源分配器。任務(wù)資源分配器將集群上的資源映射為一個M×N的矩陣AR,矩陣中M代表每個機柜中的CPU節(jié)點數(shù)目,N代表機柜的數(shù)目,則其中的任一資源節(jié)點為Ai,j,其中0<i≤M,0<j≤N;資源狀態(tài)矩陣表示集群上的資源狀態(tài),標(biāo)志Fi,j表示該資源上是否有正在運行的任務(wù),如果Fi,j=1表示有任務(wù)在其上運行,F(xiàn)i,j=0表示該節(jié)點是空閑節(jié)點。
任務(wù)資源分配器的分配方法如下:
第1步:任務(wù)調(diào)度器從用戶提交的任務(wù)隊列中取出排在第一位的任務(wù),確認(rèn)其所需要的資源,查看空閑資源數(shù)量是否能夠滿足用戶的資源需求;如果用戶任務(wù)的資源需求大于集群總的資源數(shù)量,則拒絕該任務(wù);如果當(dāng)前空閑資源不能滿足其資源需求,則將該任務(wù)重新放入任務(wù)提交隊列中的末尾。如果當(dāng)前空閑資源能夠滿足該用戶需求,則轉(zhuǎn)第2步。
第2步:調(diào)度器查看當(dāng)前空閑資源的排列情況,如果該作業(yè)是集群上提交的第一個作業(yè),則從資源隊列的位置0,0開始算起。否則,從上次提交任務(wù)時,所選中的最后一個資源節(jié)點位置(X,Y)開始算起,轉(zhuǎn)第3步。
第3步:在為該任務(wù)尋找空閑資源位置時,根據(jù)兩個參數(shù)P與Q的設(shè)定值進行資源定位。其中P代表在資源矩陣中行的初始跳變數(shù),Q代表列的跳變數(shù),如(P,Q)=(4,2),表示當(dāng)前節(jié)點位置的下一節(jié)點位置(U,V)為((i+4)mod?M,(j+2)mod?N)。如果下一位置已經(jīng)被任務(wù)占用,轉(zhuǎn)第4步。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于華東交通大學(xué),未經(jīng)華東交通大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010247472.9/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 一種集群調(diào)度呼叫業(yè)務(wù)中主叫終端信息顯示方法
- 更新網(wǎng)絡(luò)流量管理設(shè)備同時維持有效性
- 與集群調(diào)度系統(tǒng)進行通信的方法、群集接入網(wǎng)關(guān)及系統(tǒng)
- 一種管理集群通信系統(tǒng)資源的方法
- 基于Kubernetes和OpenStack容器云平臺多集群構(gòu)建方法、介質(zhì)、設(shè)備
- 一種容災(zāi)系統(tǒng)、容災(zāi)處理方法、監(jiān)控節(jié)點和備份集群
- 一種ETCD集群恢復(fù)方法、系統(tǒng)、設(shè)備及計算機介質(zhì)
- 混合云場景下保證可用集群數(shù)量的方法、裝置及系統(tǒng)
- 一種集群拓?fù)涓路椒ā⑾到y(tǒng)、設(shè)備及計算機存儲介質(zhì)
- 集群切換方法、集群切換裝置、電子設(shè)備及可讀存儲介質(zhì)





