[發(fā)明專利]基于異構(gòu)眾核處理器的并行程序段劃分方法有效
| 申請(qǐng)?zhí)枺?/td> | 201210441326.9 | 申請(qǐng)日: | 2012-11-06 |
| 公開(kāi)(公告)號(hào): | CN102929723A | 公開(kāi)(公告)日: | 2013-02-13 |
| 發(fā)明(設(shè)計(jì))人: | 陳德訓(xùn);房田文;吳宏 | 申請(qǐng)(專利權(quán))人: | 無(wú)錫江南計(jì)算技術(shù)研究所 |
| 主分類號(hào): | G06F9/50 | 分類號(hào): | G06F9/50 |
| 代理公司: | 北京集佳知識(shí)產(chǎn)權(quán)代理有限公司 11227 | 代理人: | 駱蘇華 |
| 地址: | 214083 江蘇*** | 國(guó)省代碼: | 江蘇;32 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 異構(gòu)眾核 處理器 并行 程序 劃分 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及計(jì)算機(jī)領(lǐng)域,尤其涉及一種基于異構(gòu)眾核處理器的并行程序段劃分方法。
背景技術(shù)
近年來(lái),為了提高系統(tǒng)的計(jì)算能力,多核、眾核處理器逐漸成為高性能計(jì)算機(jī)的主體組建部件。另一方面,面向解決特定問(wèn)題是微處理器設(shè)計(jì)的發(fā)展方向,異構(gòu)處理器針對(duì)特定領(lǐng)域問(wèn)題的特殊性進(jìn)行了處理器核心的異構(gòu)設(shè)計(jì),即將典型工作負(fù)載中不同類型操作進(jìn)行區(qū)分,分別用不同的處理器核來(lái)處理,以獲得整體上的高性能。這種結(jié)構(gòu)與同構(gòu)多核處理器系統(tǒng)構(gòu)成極大規(guī)模的多態(tài)異構(gòu)計(jì)算系統(tǒng)。多態(tài)異構(gòu)系統(tǒng)計(jì)算能力強(qiáng)、能效比高,是解決重大應(yīng)用的重要發(fā)展方向之一,同時(shí)系統(tǒng)的超大并行規(guī)模和多態(tài)復(fù)雜的體系結(jié)構(gòu),給傳統(tǒng)高性能計(jì)算應(yīng)用帶來(lái)巨大的挑戰(zhàn),與之匹配的并行實(shí)現(xiàn)技術(shù)缺乏。因此研究基于異構(gòu)眾核處理器的多粒度并行程序基本段劃分方法,成為本領(lǐng)域技術(shù)人員亟待解決的技術(shù)難題。
在支持異構(gòu)計(jì)算機(jī)系統(tǒng)的并行程序?qū)崿F(xiàn)方法方面,當(dāng)前面向異構(gòu)計(jì)算機(jī)系統(tǒng)的并行實(shí)現(xiàn)大都基于兩級(jí)并行模型,即MPI(“消息傳遞接口”,MessagePassing?Interface)并行+眾核并行兩級(jí)方式,MPI級(jí)實(shí)現(xiàn)進(jìn)程級(jí)的粗粒度并行、眾核并行主要完成核心迭代部分的加速計(jì)算,即僅根據(jù)核心循環(huán)進(jìn)行細(xì)粒度的眾核并行。在MPI并行+眾核并行的兩級(jí)混合并行編程模型的實(shí)現(xiàn)和優(yōu)化技術(shù)中,MPI級(jí)并行主要采用MPI通信和計(jì)算的重疊進(jìn)行優(yōu)化,眾核級(jí)并行主要采用數(shù)據(jù)布局優(yōu)化、數(shù)據(jù)傳輸優(yōu)化、計(jì)算和訪存重疊等方法進(jìn)行性能調(diào)優(yōu)。具體課題的加速效果與課題計(jì)算特點(diǎn)和優(yōu)化技術(shù)實(shí)現(xiàn)密切相關(guān)。
據(jù)目前可查文獻(xiàn),應(yīng)用領(lǐng)域的眾核并行實(shí)現(xiàn)僅針對(duì)其中計(jì)算量耗費(fèi)巨大的部分核心計(jì)算或某簡(jiǎn)單問(wèn)題的整體求解過(guò)程進(jìn)行,對(duì)諸多復(fù)雜實(shí)際問(wèn)題的數(shù)值模擬求解沒(méi)有全面深入的解決辦法,因此目前異構(gòu)計(jì)算機(jī)系統(tǒng)的主要并行應(yīng)用的MPI級(jí)并行規(guī)模都在百千量級(jí),很難支撐更大規(guī)模和更復(fù)雜的并行計(jì)算應(yīng)用。實(shí)際應(yīng)用課題的整體加速效果一般。
此外,僅根據(jù)核心循環(huán)進(jìn)行眾核級(jí)的細(xì)粒度并行,其并行效率受限于實(shí)際運(yùn)行課題的規(guī)模。例如,若實(shí)際課題運(yùn)行的網(wǎng)格規(guī)模某維大小為M,異構(gòu)眾核處理器上從核數(shù)為N,如果根據(jù)核心循環(huán)進(jìn)行眾核級(jí)的細(xì)粒度并行,在M<N時(shí),則(N-M)個(gè)從核的計(jì)算能力沒(méi)有得到利用。而當(dāng)M>N且M不是N的整數(shù)倍時(shí),從核級(jí)細(xì)粒度并行的負(fù)載平衡效果將很不理想。因此,現(xiàn)有核心循環(huán)的眾核級(jí)細(xì)粒度并行技術(shù)難以充分發(fā)揮從核的計(jì)算能力。
在公開(kāi)號(hào)為CN1783011A的中國(guó)專利申請(qǐng)中,披露了更多相關(guān)內(nèi)容。
發(fā)明內(nèi)容
本發(fā)明所要解決的技術(shù)問(wèn)題是解決一般科學(xué)計(jì)算與工程類應(yīng)用在多態(tài)異構(gòu)計(jì)算機(jī)系統(tǒng)上的適應(yīng)性問(wèn)題,同時(shí)提高眾核級(jí)的并行效率和負(fù)載平衡效果。
為了解決上述問(wèn)題,本發(fā)明提供了一種基于異構(gòu)眾核處理器的并行程序段劃分方法,包括:
對(duì)應(yīng)用課題的數(shù)據(jù)進(jìn)行數(shù)據(jù)相關(guān)性分析,以確定是否存在無(wú)數(shù)據(jù)相關(guān)性的程序基本段;
若存在所述無(wú)數(shù)據(jù)相關(guān)性的程序基本段,則計(jì)算各無(wú)數(shù)據(jù)相關(guān)性的程序基本段的計(jì)算量;根據(jù)所述計(jì)算量,對(duì)所述無(wú)數(shù)據(jù)相關(guān)性的程序基本段進(jìn)行第一級(jí)眾核劃分。
可選的,在所述進(jìn)行第一級(jí)眾核劃分之后,還包括:
分析各無(wú)數(shù)據(jù)相關(guān)性的程序基本段,將所述程序基本段分解為多個(gè)計(jì)算循環(huán);
對(duì)每個(gè)計(jì)算循環(huán)內(nèi)的數(shù)據(jù)進(jìn)行數(shù)據(jù)遞歸相關(guān)性分析,以確定是否存在無(wú)數(shù)據(jù)遞歸相關(guān)性的計(jì)算循環(huán);
若存在所述無(wú)數(shù)據(jù)遞歸相關(guān)性的計(jì)算循環(huán),則對(duì)所述無(wú)數(shù)據(jù)遞歸相關(guān)性的計(jì)算循環(huán)進(jìn)行第二級(jí)眾核劃分。
可選的,所述計(jì)算量包括:浮點(diǎn)計(jì)算量和定點(diǎn)計(jì)算量。
可選的,所述進(jìn)行第一級(jí)眾核劃分包括:以第一粒度進(jìn)行第一級(jí)的任務(wù)劃分和負(fù)載平衡。
可選的,所述進(jìn)行第一級(jí)眾核劃分包括:以第一粒度進(jìn)行第一級(jí)的任務(wù)劃分和負(fù)載平衡;
所述進(jìn)行第二級(jí)眾核劃分包括:以第二粒度進(jìn)行第二級(jí)的任務(wù)劃分和負(fù)載平衡。
可選的,所述第二粒度小于所述第一粒度。
可選的,在所述對(duì)應(yīng)用課題的數(shù)據(jù)進(jìn)行數(shù)據(jù)相關(guān)性分析之前,還包括:
對(duì)所述應(yīng)用課題進(jìn)行計(jì)算方法分析;
基于所述計(jì)算方法分析的結(jié)果,對(duì)所述應(yīng)用課題以第三粒度進(jìn)行MPI級(jí)并行任務(wù)劃分。
可選的,所述第三粒度大于所述第一粒度。
與現(xiàn)有技術(shù)相比,本發(fā)明的技術(shù)方案具有以下優(yōu)點(diǎn):
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于無(wú)錫江南計(jì)算技術(shù)研究所,未經(jīng)無(wú)錫江南計(jì)算技術(shù)研究所許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210441326.9/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 眾核處理器及其空間訪問(wèn)的方法、主核
- 一種用于異構(gòu)眾核系統(tǒng)下的應(yīng)用程序線程數(shù)動(dòng)態(tài)調(diào)整方法
- 一種面向異構(gòu)眾核芯片的量化功耗控制方法
- 一種代碼生成方法、裝置、設(shè)備及可讀存儲(chǔ)介質(zhì)
- 異構(gòu)眾核架構(gòu)下的運(yùn)算核作業(yè)遷移方法
- 基于異構(gòu)眾核處理器的卷積加速方法
- 基于異構(gòu)眾核處理器的卷積計(jì)算數(shù)據(jù)重用方法
- 面向異構(gòu)眾核處理器的輕量級(jí)軟件調(diào)試方法
- 面向申威眾核架構(gòu)的稀疏矩陣存儲(chǔ)方法
- 一種基于異構(gòu)眾核架構(gòu)的并行海洋藥物篩選方法
- 簡(jiǎn)單網(wǎng)絡(luò)管理協(xié)議設(shè)備的數(shù)據(jù)并行采集歸并方法及系統(tǒng)
- 減少EMI的并行數(shù)據(jù)傳輸方法
- 一種多媒體數(shù)據(jù)并行處理系統(tǒng)及方法
- 一種高速并行OQPSK解調(diào)時(shí)鐘的恢復(fù)系統(tǒng)
- 一種海量地震數(shù)據(jù)并行抽道集方法
- 3G協(xié)議的turbo碼并行譯碼方法及裝置
- 并行擴(kuò)展輸入輸出的教學(xué)裝置
- 數(shù)據(jù)的并行處理
- 并行式插件機(jī)
- 一種SPI總線與并行總線的橋接方法、設(shè)備、系統(tǒng)及介質(zhì)





