[發(fā)明專利]一種基于異構(gòu)多核芯片的細(xì)粒度科學(xué)計(jì)算并行處理裝置無效
| 申請(qǐng)?zhí)枺?/td> | 201210105722.4 | 申請(qǐng)日: | 2012-04-11 |
| 公開(公告)號(hào): | CN103377032A | 公開(公告)日: | 2013-10-30 |
| 發(fā)明(設(shè)計(jì))人: | 劉鵬;楊劼;顧雄禮;史冊 | 申請(qǐng)(專利權(quán))人: | 浙江大學(xué) |
| 主分類號(hào): | G06F9/38 | 分類號(hào): | G06F9/38 |
| 代理公司: | 杭州宇信知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 33231 | 代理人: | 張宇娟 |
| 地址: | 310027 浙*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 多核 芯片 細(xì)粒度 科學(xué) 計(jì)算 并行 處理 裝置 | ||
技術(shù)領(lǐng)域
本發(fā)明屬于計(jì)算機(jī)應(yīng)用技術(shù)領(lǐng)域,特別地涉及一種基于異構(gòu)多核芯片的細(xì)粒度科學(xué)計(jì)算并行處理裝置。
背景技術(shù)
自多核處理器芯片研發(fā)出來,首先用于以科學(xué)計(jì)算為主的超級(jí)計(jì)算機(jī)。由于超級(jí)計(jì)算機(jī)需要大的計(jì)算能力,本來就是由多處理器構(gòu)成,應(yīng)用的軟件是并行軟件,當(dāng)多處理器核芯片研發(fā)出來,能做到大的計(jì)算能力,應(yīng)用的軟件無需做大的更改就能方便的移植,因此能很順利的用于超級(jí)計(jì)算機(jī)。
在從事于嵌入式片上多核系統(tǒng)的應(yīng)用研究時(shí),也需要借鑒研究超級(jí)計(jì)算機(jī)并行編程的經(jīng)驗(yàn)。從處理器體系結(jié)構(gòu)來看,根據(jù)核結(jié)構(gòu)的不同,片上多處理器可以分為同構(gòu)和異構(gòu)兩種類型。同構(gòu)多核處理器指芯片內(nèi)部所有處理器核的結(jié)構(gòu)完全相同,每個(gè)核的功能、地位完全一致,可以單獨(dú)地執(zhí)行任務(wù),與通用單核處理器功能、結(jié)構(gòu)相近。異構(gòu)多核處理器芯片內(nèi)部包含多個(gè)功能不同的處理器核,不同的處理器核負(fù)責(zé)處理不同的任務(wù)。異構(gòu)多核處理器目前主要應(yīng)用于專用計(jì)算領(lǐng)域,如多媒體處理器、嵌入式處理器和超級(jí)機(jī)的處理器,通常包含通用處理器和專門用于計(jì)算加速的處理器,如數(shù)字信號(hào)處理器,網(wǎng)絡(luò)處理器,流媒體處理器等,其中通用處理器通常負(fù)責(zé)多核系統(tǒng)的管理而加速處理器主要完成特定的計(jì)算任務(wù)。由于異構(gòu)片上多處理器可以根據(jù)應(yīng)用需求而采用不同的處理器核來構(gòu)建多核處理器,異構(gòu)結(jié)構(gòu)可以在性能與功耗比上達(dá)到最佳。由于細(xì)粒度科學(xué)計(jì)算程序中任務(wù)計(jì)算量與通信量的比值較小,一般需要盡可能增大處理器用于計(jì)算部分的比例以達(dá)到較高效率,而異構(gòu)結(jié)構(gòu)利用通用處理器管理多核系統(tǒng)而將加速處理器解放出來專門用于計(jì)算,因此采用異構(gòu)結(jié)構(gòu)能夠保證細(xì)粒度科學(xué)計(jì)算程序在片上多核系統(tǒng)的高效運(yùn)行。
面向多核處理器上的并行計(jì)算問題是并行軟件開發(fā)的一個(gè)熱點(diǎn),其關(guān)注點(diǎn)主要在于并行計(jì)算如何進(jìn)行進(jìn)程/線程的分配和調(diào)度。分配策略是將進(jìn)程分配到合理的處理器核上,由于采用異構(gòu)結(jié)構(gòu),不同的處理器核性質(zhì)不同,在不同時(shí)刻運(yùn)行狀態(tài)不同,因此分配的合理性會(huì)影響系統(tǒng)性能。最重要和典型的幾種并行計(jì)算模型包括隨機(jī)存取并行機(jī)器(Parallel?Random?Access?Machine,PRAM)模型、整體同步并行計(jì)算模型(Bulk?Synchronous?Parallel?Computing?Model,BSP)模型和分布存儲(chǔ)的、點(diǎn)到點(diǎn)通信的多處理機(jī)模型(Latency?overhead?gap?Processor,LogP)模型。在不同的假設(shè)下,每個(gè)模型有很多擴(kuò)展。PRAM模型面向單指令流多數(shù)據(jù)流并行機(jī),它需要并行機(jī)具有共享存儲(chǔ),并且要求在任意時(shí)刻處理器可以訪問共享存儲(chǔ)單元,不適合分布式存儲(chǔ)結(jié)構(gòu)的異構(gòu)多核平臺(tái)。BSP模型并不要求并行機(jī)的存儲(chǔ)器,可以是共享或分布機(jī)制,但針對(duì)異構(gòu)多核平臺(tái)沒有對(duì)應(yīng)的擴(kuò)展。LogP模型面向分布式存儲(chǔ)器,但要求處理器間的消息傳遞機(jī)制只能是單點(diǎn)對(duì)單點(diǎn)的,并且要服從固定順序,不適合具有一對(duì)多消息傳遞的科學(xué)計(jì)算。
因此,目前在片上異構(gòu)多核系統(tǒng)中,對(duì)于細(xì)粒度科學(xué)計(jì)算應(yīng)用的并行化實(shí)現(xiàn)并沒有一個(gè)具有針對(duì)性的解決方案,從而影響了細(xì)粒度科學(xué)計(jì)算應(yīng)用在片上異構(gòu)多核系統(tǒng)中所能得到的性能。故,針對(duì)目前現(xiàn)有技術(shù)中存在的上述缺陷,實(shí)有必要進(jìn)行研究,以提供一種方案,解決現(xiàn)有技術(shù)中存在的缺陷,避免造成細(xì)粒度科學(xué)計(jì)算應(yīng)用在片上異構(gòu)多核系統(tǒng)中所能得到的性能較差。
發(fā)明內(nèi)容
為解決上述問題,本發(fā)明的目的在于提供一種基于異構(gòu)多核芯片的細(xì)粒度科學(xué)計(jì)算并行處理裝置,用于片上異構(gòu)多核系統(tǒng),針對(duì)細(xì)粒度科學(xué)計(jì)算。通過定義科學(xué)計(jì)算類型,確定應(yīng)用程序和操作系統(tǒng)之間的協(xié)議來減少科學(xué)計(jì)算在片上異構(gòu)多核系統(tǒng)上運(yùn)行時(shí)的計(jì)算開銷、調(diào)用開銷和通信開銷,完成對(duì)細(xì)粒度科學(xué)計(jì)算在片上異構(gòu)多核系統(tǒng)上的并行化和性能調(diào)優(yōu)。
為實(shí)現(xiàn)上述目的,本發(fā)明的技術(shù)方案為:
一種基于異構(gòu)多核芯片的細(xì)粒度科學(xué)計(jì)算并行處理裝置,應(yīng)用于包括一個(gè)主核和至少一個(gè)從核的異構(gòu)多核芯片,包括接口模塊,記錄模塊,對(duì)象分配模塊和代理管理器模塊,
所述接口模塊運(yùn)行在主核上,用于實(shí)現(xiàn)應(yīng)用程序和操作系統(tǒng)之間的協(xié)議,根據(jù)對(duì)象的數(shù)據(jù)依賴關(guān)系生成任務(wù)類型標(biāo)識(shí)FLAG,并傳入所述記錄模塊;
所述記錄模塊運(yùn)行在主核上,用于記錄應(yīng)用程序和操作系統(tǒng)之間協(xié)議中定義的關(guān)于對(duì)象的信息,記錄包括按照數(shù)據(jù)流模型確定的任務(wù)類型標(biāo)識(shí)FLAG和后續(xù)對(duì)象目的處理器編號(hào)TaskDest;
所述對(duì)象分配模塊運(yùn)行在主核上,用于初始化時(shí)對(duì)象的分配,所述對(duì)象分配模塊根據(jù)FLAG值和TaskDest將任務(wù)分配到對(duì)應(yīng)的從核上,并更新對(duì)應(yīng)從核上的代理管理器的對(duì)象表中的FLAG和TaskDest;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于浙江大學(xué),未經(jīng)浙江大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210105722.4/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 一種管理和傳送細(xì)粒度業(yè)務(wù)的方法
- 基于CPU硬件性能監(jiān)控計(jì)數(shù)器的CPI精確測量方法
- 一種基于改進(jìn)YOLOv3的細(xì)粒度圖像分類方法
- 細(xì)粒度對(duì)象流量分析方法和裝置
- 一種基于點(diǎn)云數(shù)據(jù)建模的方法、裝置和電子設(shè)備
- 細(xì)粒度圖像分類方法、系統(tǒng)、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 基于圖像卷積特征的復(fù)雜背景下害蟲細(xì)粒度圖像識(shí)別方法
- 一種細(xì)粒度分類模型的優(yōu)化方法、系統(tǒng)及相關(guān)裝置
- 一種結(jié)合注意力混合裁剪的細(xì)粒度圖像識(shí)別方法
- 基于分級(jí)式結(jié)構(gòu)的細(xì)粒度視頻動(dòng)作識(shí)別方法





