[發(fā)明專利]屏障同步機(jī)制在審
| 申請(qǐng)?zhí)枺?/td> | 202011412340.7 | 申請(qǐng)日: | 2020-12-03 |
| 公開(kāi)(公告)號(hào): | CN113298691A | 公開(kāi)(公告)日: | 2021-08-24 |
| 發(fā)明(設(shè)計(jì))人: | J·瓦萊里奧;V·蘭甘納坦;J·雷 | 申請(qǐng)(專利權(quán))人: | 英特爾公司 |
| 主分類號(hào): | G06T1/20 | 分類號(hào): | G06T1/20;G06F15/78;G06N20/00 |
| 代理公司: | 上海專利商標(biāo)事務(wù)所有限公司 31100 | 代理人: | 徐倩;黃嵩泉 |
| 地址: | 美國(guó)加利*** | 國(guó)省代碼: | 暫無(wú)信息 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 屏障 同步 機(jī)制 | ||
公開(kāi)了一種用于促進(jìn)線程屏障同步的裝置:該裝置包括:多個(gè)處理資源,其用于執(zhí)行線程工作組中包括的多個(gè)執(zhí)行線程;以及屏障同步硬件,其用于將第一命名屏障分配給線程工作組中的第一組多個(gè)執(zhí)行線程,將第二命名屏障分配給線程工作組中的第二組多個(gè)執(zhí)行線程,經(jīng)由第一命名屏障來(lái)同步第一組執(zhí)行線程的執(zhí)行,并經(jīng)由第二命名屏障來(lái)同步第二組執(zhí)行線程的執(zhí)行。
背景技術(shù)
圖形處理單元(GPU)是高度線程化機(jī)器,其中并行地執(zhí)行程序的數(shù)百個(gè)線程以實(shí)現(xiàn)高吞吐量。GPU線程工作組(或組)被實(shí)現(xiàn)在網(wǎng)格著色應(yīng)用中以執(zhí)行三維(3D)渲染。在GPU內(nèi)實(shí)現(xiàn)了同步屏障,以使線程組中的線程能夠等待直到所有線程到達(dá)特定的執(zhí)行點(diǎn),然后再繼續(xù)執(zhí)行任何線程。
常規(guī)屏障的問(wèn)題是每個(gè)工作組只能定義一個(gè)屏障。例如,如果組大小包括十六個(gè)硬件線程,但是緩沖器的生產(chǎn)者-消費(fèi)者關(guān)系僅包括八個(gè)線程,則屏障必須等待所有十六個(gè)線程到達(dá)同步點(diǎn)。因此,每個(gè)線程在飛行中只能有一個(gè)屏障信號(hào)消息。
附圖說(shuō)明
為了以能夠詳細(xì)理解本發(fā)明的以上記載特征的方式,可通過(guò)參考實(shí)施例來(lái)對(duì)以上簡(jiǎn)要概括的本發(fā)明進(jìn)行更具體的描述,這些實(shí)施例中的一些在所附附圖中被圖示。然而,應(yīng)注意的是,附圖僅展示本發(fā)明的典型的實(shí)施例,且因此將不被視為限制其范圍,因?yàn)楸景l(fā)明可以承認(rèn)其他等效實(shí)施例。
圖1是根據(jù)實(shí)施例的處理系統(tǒng)的框圖;
圖2A-圖2D圖示由本文中描述的實(shí)施例提供的計(jì)算系統(tǒng)和圖形處理器;
圖3A-圖3C圖示由實(shí)施例提供的附加的圖形處理器和計(jì)算加速器架構(gòu)的框圖;
圖4是根據(jù)一些實(shí)施例的圖形處理器的圖形處理引擎的框圖;
圖5A-圖5B圖示根據(jù)實(shí)施例的包括在圖形處理器核中采用的處理元件陣列的線程執(zhí)行邏輯500;
圖6圖示根據(jù)實(shí)施例的附加執(zhí)行單元600;
圖7是圖示根據(jù)一些實(shí)施例的圖形處理器指令格式的框圖;
圖8是根據(jù)另一實(shí)施例的圖形處理器的框圖;
圖9A和圖9B圖示根據(jù)一些實(shí)施例的圖形處理器命令格式和命令序列;
圖10圖示根據(jù)一些實(shí)施例的用于數(shù)據(jù)處理系統(tǒng)的示例性圖形軟件架構(gòu);
圖11A-圖11D圖示根據(jù)實(shí)施例的集成電路封裝組件;
圖12是圖示根據(jù)實(shí)施例的示例性芯片上系統(tǒng)集成電路的框圖;
圖13A和圖13B是圖示附加的示例性圖形處理器的框圖;
圖14圖示根據(jù)實(shí)施例的機(jī)器學(xué)習(xí)軟件棧;
圖15A-圖15B圖示示例性深度神經(jīng)網(wǎng)絡(luò)的多個(gè)層;
圖16圖示示例性遞歸神經(jīng)網(wǎng)絡(luò);
圖17圖示深度神經(jīng)網(wǎng)絡(luò)的訓(xùn)練和部署;
圖18是示出分布式學(xué)習(xí)的框圖;
圖19圖示計(jì)算設(shè)備的一個(gè)實(shí)施例;
圖20示出GPU的一個(gè)實(shí)施例;
圖21圖示子切片(sub-slice)的一個(gè)實(shí)施例;
圖22是圖示用于執(zhí)行屏障同步進(jìn)程的過(guò)程的一個(gè)實(shí)施例的流程圖;以及
圖23圖示使用命名屏障來(lái)實(shí)現(xiàn)卷積核流程的偽代碼的一個(gè)實(shí)施例。
具體實(shí)施方式
在以下描述中,陳述許多具體細(xì)節(jié)以提供對(duì)本發(fā)明的更透徹理解。然而,將對(duì)本領(lǐng)域技術(shù)人員顯而易見(jiàn)的是,可在沒(méi)有這些特定細(xì)節(jié)中的一個(gè)或多個(gè)細(xì)節(jié)的情況下實(shí)施本發(fā)明。在其他實(shí)例中,未描述公知的特征以避免使本發(fā)明模糊。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于英特爾公司,未經(jīng)英特爾公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011412340.7/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 一種機(jī)制蛋的制造方法
- 手機(jī)制式的校準(zhǔn)方法、系統(tǒng)及手機(jī)檢測(cè)設(shè)備
- 一種考慮激勵(lì)機(jī)制電量電價(jià)彈性矩陣的耗電量估測(cè)方法
- 選擇區(qū)塊鏈共識(shí)機(jī)制的方法、裝置以及共識(shí)節(jié)點(diǎn)
- 一種復(fù)合改性機(jī)制砂及其制備方法
- 一種存儲(chǔ)設(shè)備糾錯(cuò)方法及糾錯(cuò)裝置
- 區(qū)塊鏈中共識(shí)機(jī)制的處理方法、裝置和電子設(shè)備
- 一種建筑用機(jī)制砂整形裝置
- 通信方法、通信裝置及存儲(chǔ)介質(zhì)
- 一種網(wǎng)絡(luò)預(yù)約出租車(chē)市場(chǎng)準(zhǔn)入機(jī)制的優(yōu)化方法及系統(tǒng)





