[發(fā)明專利]面向CPU+GPU處理器的混合粒度一致性維護方法有效
| 申請?zhí)枺?/td> | 201510092458.9 | 申請日: | 2015-03-02 |
| 公開(公告)號: | CN104615576B | 公開(公告)日: | 2017-03-15 |
| 發(fā)明(設(shè)計)人: | 邢座程;唐川;張洋;劉蒼;湯先拓;王鋒;王慶林;原略超;呂朝;董永旺;危樂 | 申請(專利權(quán))人: | 中國人民解放軍國防科學(xué)技術(shù)大學(xué) |
| 主分類號: | G06F15/16 | 分類號: | G06F15/16 |
| 代理公司: | 國防科技大學(xué)專利服務(wù)中心43202 | 代理人: | 郭敏 |
| 地址: | 410073 湖*** | 國省代碼: | 湖南;43 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 面向 cpu gpu 處理器 混合 粒度 一致性 維護 方法 | ||
1.一種面向CPU+GPU處理器的混合粒度一致性維護方法,其特征在于包括以下步驟:
第一步,設(shè)計一個由一個粗粒度的域目錄和一個細(xì)粒度的塊目錄組成的混合粒度的雙目錄結(jié)構(gòu),嵌在L2?Cache和主存通道之間,域目錄和塊目錄相互通信,完成一致性信息的更新和維護以及數(shù)據(jù)的傳遞,且域目錄支持通過DMA總線從主存獲得數(shù)據(jù)響應(yīng),
1.1域目錄設(shè)計方法是:
域目錄與GPU二級緩存、CPU二級緩存、塊目錄和主存通道相連,域目錄接收來自GPU二級緩存、CPU二級緩存和塊目錄的訪存請求,域目錄在塊目錄的輔助下實現(xiàn)GPU請求的數(shù)據(jù)的一致性訪問,并輔助塊目錄實現(xiàn)CPU請求的數(shù)據(jù)的一致性訪問;
域目錄由MSHR隊列C、多路選擇器C、域目錄陣列和域目錄控制單元組成;MSHR隊列C接收來自GPU二級緩存和CPU二級緩存的訪存請求,將訪存請求暫存,隊列的順序也即請求響應(yīng)的順序,MSHR隊列C通過多路選擇器C與域目錄陣列相連;多路選擇器C與MSHR隊列C、域目錄陣列相連,根據(jù)MSHR隊列C中訪存請求的地址在域目錄陣列中定位對應(yīng)域目錄項;
域目錄陣列采用多體結(jié)構(gòu)的組織方式,域目錄陣列的每個體都有自己的訪問端口,每個體結(jié)構(gòu)由多個域目錄項組成,每個域目錄項包含三個域,分別是域標(biāo)志位、CPU計數(shù)器和GPU計數(shù)器;域標(biāo)志位是當(dāng)前域目錄項記錄的區(qū)域地址的部分比特位,多路選擇器C通過將請求地址與域標(biāo)志位比較,定位請求對應(yīng)的域目錄項;CPU計數(shù)器和GPU計數(shù)器分別記錄域目錄項對應(yīng)區(qū)域在CPU和GPU二級緩存中的Cacheline副本數(shù),所述區(qū)域是指一片連續(xù)的Cacheline;
域目錄陣列的輸出端連接域目錄控制單元,域目錄陣列將定位到的域目錄項的一致性信息即GPU計數(shù)器和CPU計數(shù)器的值發(fā)送給域目錄控制單元;
域目錄控制單元與塊目錄中的塊目錄控制單元協(xié)作完成一致性的數(shù)據(jù)訪問的控制任務(wù);域目錄控制單元與域目錄陣列、直接訪存總線接口、塊目錄控制單元、GPU二級緩存、多路選擇器C連接,域目錄控制單元向直接訪存總線接口發(fā)送對主存通道的訪問請求,直接訪存總線接口將請求轉(zhuǎn)發(fā)給主存通道,將主存通道返回的數(shù)據(jù)傳給域目錄控制單元;
域目錄控制單元將自己無法單獨處理的請求發(fā)給塊目錄控制單元,由塊目錄控制單元協(xié)助完成一致性的訪問請求;或者域目錄控制單元將數(shù)據(jù)反饋給塊目錄控制單元,以響應(yīng)塊目錄控制單元發(fā)出的請求;
域目錄控制單元向GPU二級緩存發(fā)送檢查請求,并從GPU二級緩存接收響應(yīng)的數(shù)據(jù);
域目錄控制單元向多路選擇器C發(fā)送對域目錄陣列的訪問請求,多路選擇器C在域目錄陣列中定位到對應(yīng)域目錄項后,由域目錄陣列將該項的信息發(fā)送給域目錄控制單元;
1.2塊目錄設(shè)計方法是:
塊目錄與CPU二級緩存、域目錄以及主存通道相連,塊目錄接收來自CPU二級緩存和域目錄的訪存請求,塊目錄在域目錄的輔助下實現(xiàn)CPU請求的數(shù)據(jù)的一致性訪問,并輔助域目錄實現(xiàn)GPU請求的數(shù)據(jù)的一致性訪問;
塊目錄由MSHR隊列D、多路選擇器D、塊目錄陣列和塊目錄控制單元組成;
MSHR隊列D與CPU二級緩存、多路選擇器D相連,接受來自CPU二級緩存的訪存請求;多路選擇器D與MSHR隊列D、塊目錄陣列相連,根據(jù)MSHR隊列D中訪存請求的地址在塊目錄陣列中定位對應(yīng)塊目錄項;
塊目錄陣列采用多體結(jié)構(gòu)的組織方式,每個體結(jié)構(gòu)由多個塊目錄項組成,每個塊目錄項包含三個域,分別是塊標(biāo)志位、狀態(tài)位、共享者列表;塊標(biāo)志位是當(dāng)前塊目錄項記錄的Cacheline地址的部分比特位,多路選擇器D通過將請求地址與塊標(biāo)志位比較定位塊目錄項;狀態(tài)位用于記錄當(dāng)前Cacheline的一致性狀態(tài),它包括私有、共享、無效三種狀態(tài),私有狀態(tài)標(biāo)識當(dāng)前Cacheline僅有一份,且已被修改;共享狀態(tài)標(biāo)識當(dāng)前Cacheline有多個副本,或者當(dāng)前Cacheline只有一份,但是未被修改,緩存中的數(shù)據(jù)與主存中的數(shù)據(jù)保持一致;無效狀態(tài)標(biāo)識當(dāng)前Cacheline是無效的,不存在于CPU二級緩存中;共享者列表用以記錄擁有當(dāng)前Cacheline數(shù)據(jù)副本的處理器簇;
塊目錄陣列的輸出端連接著塊目錄控制單元,塊目錄陣列將索引定位到的塊目錄項的一致性狀態(tài)信息即狀態(tài)位和共享者列表信息發(fā)送給塊目錄控制單元;
塊目錄控制單元與域目錄控制單元協(xié)作完成一致性的數(shù)據(jù)訪問的控制任務(wù),塊目錄控制單元與塊目錄陣列、主存通道、域目錄控制單元、CPU二級緩存、多路選擇器D相連;
塊目錄控制單元向主存通道發(fā)送數(shù)據(jù)訪問請求,并接收主存通道返回的數(shù)據(jù)響應(yīng);
塊目錄控制單元將自己無法單獨處理的請求發(fā)給域目錄控制單元,由域目錄控制單元協(xié)助完成一致性的訪問請求;或者塊目錄控制單元將數(shù)據(jù)反饋給域目錄控制單元,以響應(yīng)域目錄控制單元發(fā)出的請求;
塊目錄控制單元向CPU二級緩存發(fā)送檢查請求,并從CPU二級緩存接收響應(yīng)的數(shù)據(jù);
塊目錄控制單元向多路選擇器D發(fā)送對塊目錄陣列的訪問請求,多路選擇器D在塊目錄陣列中定位到對應(yīng)塊目錄項后,由塊目錄陣列將該項的信息發(fā)送給塊目錄控制單元;
第二步,基于混合粒度的雙目錄結(jié)構(gòu)維護數(shù)據(jù)訪問的一致性,方法是:若訪存請求的初始來源為GPU,轉(zhuǎn)2.1;若訪存請求的初始來源為CPU,轉(zhuǎn)2.2;
2.1采用GPU請求維護流程:
2.1.1、GPU訪問GPU二級緩存:當(dāng)請求為逐出請求時,轉(zhuǎn)2.1.1.1;當(dāng)請求為寫回請求時,轉(zhuǎn)2.1.1.2;當(dāng)請求為讀請求時,且在GPU二級緩存中匹配到了請求的目標(biāo)地址即讀命中,轉(zhuǎn)2.1.1.3;當(dāng)請求為寫請求,且GPU二級緩存命中時,即寫命中時,轉(zhuǎn)2.1.1.4;當(dāng)請求是讀或?qū)懻埱?,且GPU二級緩存缺失時,轉(zhuǎn)2.1.1.5;
2.1.1.1、當(dāng)請求為逐出請求時,GPU二級緩存逐出目標(biāo)地址對應(yīng)的Cacheline,域目錄控制單元將對應(yīng)區(qū)域的域目錄項的GPU計數(shù)器減1,此次請求完成,轉(zhuǎn)2.3;
2.1.1.2、當(dāng)請求為寫回請求時,GPU二級緩存將目標(biāo)地址對應(yīng)的Cacheline通過DMA總線寫回主存,目錄信息不作修改,此次請求完成,轉(zhuǎn)2.3;
2.1.1.3、當(dāng)請求為讀請求,且GPU二級緩存命中時,GPU直接從GPU二級緩存獲得數(shù)據(jù)響應(yīng),此次請求完成,轉(zhuǎn)2.3;
2.1.1.4、當(dāng)請求為寫請求,且GPU二級緩存命中時,GPU二級緩存檢查目標(biāo)地址數(shù)據(jù)的狀態(tài)信息,若數(shù)據(jù)為私有狀態(tài)即“臟”,表示數(shù)據(jù)被獨占,則GPU二級緩存直接修改數(shù)據(jù),此次請求完成,轉(zhuǎn)2.3;若發(fā)現(xiàn)數(shù)據(jù)非臟,則GPU二級緩存將請求轉(zhuǎn)發(fā)給域目錄處理,方法是:域目錄控制單元檢查目標(biāo)地址對應(yīng)的域目錄項,若發(fā)現(xiàn)CPU計數(shù)器為零,轉(zhuǎn)2.1.1.4.1;若發(fā)現(xiàn)CPU計數(shù)器非零,轉(zhuǎn)2.1.1.4.2;
2.1.1.4.1、GPU二級緩存直接修改請求地址對應(yīng)的數(shù)據(jù),轉(zhuǎn)2.3;
2.1.1.4.2、域目錄控制單元將請求轉(zhuǎn)發(fā)給塊目錄控制單元,由塊目錄控制單元檢查塊目錄陣列,判斷數(shù)據(jù)是否被CPU共享:若未在塊目錄陣列中匹配到請求的目標(biāo)地址即“缺失”,即塊目錄缺失,轉(zhuǎn)2.1.1.4.2.1;若塊目錄命中,轉(zhuǎn)2.1.1.4.2.2;
2.1.1.4.2.1、若塊目錄缺失,則表示目標(biāo)地址未在CPU二級緩存中緩存,則參照2.1.1.4.1的操作由GPU二級緩存直接修改數(shù)據(jù),此次請求完成,轉(zhuǎn)2.3;
2.1.1.4.2.2、若塊目錄命中,則CPU二級緩存要作廢目標(biāo)地址的副本,同時塊目錄控制單元作廢目標(biāo)地址對應(yīng)的塊目錄項,并通知域目錄控制單元更新目標(biāo)地址的域目錄項的CPU計數(shù)器減1,此次請求完成,轉(zhuǎn)2.3;
2.1.1.5、無論讀請求或?qū)懻埱?,若GPU二級緩存缺失,GPU二級緩存將請求轉(zhuǎn)發(fā)給域目錄:若域目錄缺失,轉(zhuǎn)2.1.1.5.1;若域目錄命中,轉(zhuǎn)2.1.1.5.2;
2.1.1.5.1、若域目錄缺失,說明目標(biāo)地址所在區(qū)域并未被L2Cache緩存,訪存請求直接通過DMA總線從主存得到整個區(qū)域的數(shù)據(jù)響應(yīng),同時域目錄控制單元將域目錄項中的GPU計數(shù)器設(shè)為最大值,此次請求完成,轉(zhuǎn)2.3;
2.1.1.5.2、若域目錄命中,則域目錄控制單元檢查CPU計數(shù)器和GPU計數(shù)器:若兩個計數(shù)器皆為0,轉(zhuǎn)2.1.1.5.2.1;若CPU計數(shù)器為0,GPU計數(shù)器非0,轉(zhuǎn)2.1.1.5.2.2;若CPU計數(shù)器非0,轉(zhuǎn)2.1.1.5.2.3;
2.1.1.5.2.1、若CPU計數(shù)器和GPU計數(shù)器皆為0,表示目標(biāo)地址所在區(qū)域未被緩存,參照2.1.1.5.1處理,此次請求完成,轉(zhuǎn)2.3;
2.1.1.5.2.2、若CPU計數(shù)器為0,GPU計數(shù)器非0,則僅GPU擁有當(dāng)前區(qū)域的部分?jǐn)?shù)據(jù),DMA將目標(biāo)地址的數(shù)據(jù)從主存經(jīng)域目錄控制單元傳遞給GPU二級緩存,同時域目錄控制單元將對應(yīng)域目錄項的GPU計數(shù)器加1,此次請求完成,轉(zhuǎn)2.3;
2.1.1.5.2.3、若CPU計數(shù)器非0,則表示CPU中有目標(biāo)地址所屬區(qū)域的部分?jǐn)?shù)據(jù),域目錄控制單元將請求轉(zhuǎn)發(fā)到塊目錄控制單元處理,塊目錄控制單元處理方法是:若請求為寫請求,且訪問塊目錄命中,轉(zhuǎn)2.1.1.5.2.3.1;若請求為讀請求,且訪問塊目錄命中,轉(zhuǎn)2.1.1.5.2.3.2;若請求為讀請求或?qū)懻埱?,且訪問塊目錄缺失,轉(zhuǎn)2.1.1.5.2.3.3;
2.1.1.5.2.3.1、若請求為寫請求,且訪問塊目錄命中,則塊目錄控制單元通知CPU二級緩存作廢請求數(shù)據(jù)的副本,并使塊目錄中目標(biāo)地址的塊目錄項失效,然后通知域目錄控制單元將對應(yīng)域目錄項的CPU計數(shù)器減1;
2.1.1.5.2.3.1.1、通過塊目錄控制單元將CPU二級緩存中的數(shù)據(jù)轉(zhuǎn)發(fā)給域目錄控制單元,并通知域目錄控制單元將目標(biāo)地址的域目錄項的GPU計數(shù)器加1;域目錄控制單元收到數(shù)據(jù)后直接轉(zhuǎn)發(fā)給GPU二級緩存,此次請求完成,轉(zhuǎn)2.3;
2.1.1.5.2.3.2、若請求為讀請求,且訪問塊目錄命中,表示當(dāng)前請求的數(shù)據(jù)塊在CPU二級緩存中有副本,塊目錄控制單元修改目標(biāo)地址的塊目錄項的一致性狀態(tài)信息為共享,并將GPU簇加入到該項的共享者列表中;若目標(biāo)地址原始狀態(tài)為私有狀態(tài),此時將數(shù)據(jù)寫回主存,然后執(zhí)行2.1.1.5.2.3.1.1;
2.1.1.5.2.3.3、無論讀請求或?qū)懻埱?,若訪問塊目錄缺失,表示當(dāng)前數(shù)據(jù)在CPU二級緩存中沒有副本,塊目錄控制單元向主存請求目標(biāo)地址的數(shù)據(jù),并將數(shù)據(jù)通過域目錄控制單元轉(zhuǎn)發(fā)給GPU的L2Cache,域目錄控制單元在收到數(shù)據(jù)的同時將目標(biāo)地址對應(yīng)域目錄項的GPU計數(shù)器加1,此次請求完成,轉(zhuǎn)2.3;
2.2啟動CPU請求維護流程:
2.2.1、CPU訪問CPU二級緩存:當(dāng)請求為讀請求且命中時,轉(zhuǎn)2.2.1.1;當(dāng)請求為逐出請求時,轉(zhuǎn)2.2.1.2;當(dāng)請求為寫回請求時,轉(zhuǎn)2.2.1.3;當(dāng)請求為寫請求且命中時,轉(zhuǎn)2.2.1.4;若請求為讀請求或?qū)懻埱螅褻PU二級緩存缺失時,轉(zhuǎn)2.2.1.5;
2.2.1.1、當(dāng)請求為讀請求且命中時,CPU直接從CPU二級緩存獲得數(shù)據(jù)響應(yīng),此次請求完成,轉(zhuǎn)2.3;
2.2.1.2、當(dāng)請求為逐出請求時,CPU二級緩存將請求同時轉(zhuǎn)發(fā)給域目錄和塊目錄,域目錄控制單元將對應(yīng)域目錄項的CPU計數(shù)器減1;塊目錄控制單元則作廢對應(yīng)塊目錄項,此次請求完成,轉(zhuǎn)2.3;
2.2.1.3、當(dāng)請求為寫回請求時,表示目標(biāo)數(shù)據(jù)處于私有狀態(tài),即數(shù)據(jù)為臟,將數(shù)據(jù)寫回主存后,將目標(biāo)地址的塊目錄項的狀態(tài)信息設(shè)置為共享,此次請求完成,轉(zhuǎn)2.3;
2.2.1.4、若為寫請求且命中,同時目標(biāo)地址的數(shù)據(jù)在CPU二級緩存中為臟,則表示數(shù)據(jù)已經(jīng)被獨占,CPU二級緩存直接修改請求地址的數(shù)據(jù)完成寫請求,此次請求完成,轉(zhuǎn)2.3;若請求寫命中但目標(biāo)地址的數(shù)據(jù)在CPU二級緩存中非臟,則CPU二級緩存將請求轉(zhuǎn)發(fā)給塊目錄,塊目錄對請求的處理方法是:若塊目錄的目標(biāo)地址對應(yīng)的塊目錄項中的共享者列表信息顯示GPU簇中無目標(biāo)地址的副本,轉(zhuǎn)2.2.1.4.1;反之若有目標(biāo)地址的副本,轉(zhuǎn)2.2.1.4.2;
2.2.1.4.1、若塊目錄的目標(biāo)地址對應(yīng)的塊目錄項中的共享者列表信息顯示GPU簇中無目標(biāo)地址的副本,則按傳統(tǒng)目錄一致性協(xié)議方式處理:即塊目錄僅更新對應(yīng)塊目錄項的狀態(tài)信息為私有,此次請求完成,轉(zhuǎn)2.3;
2.2.1.4.2、若塊目錄的目標(biāo)地址對應(yīng)的塊目錄項中的共享者列表信息顯示GPU簇中有目標(biāo)地址的副本,則按傳統(tǒng)目錄一致性協(xié)議方式處理:即塊目錄將對應(yīng)目錄項的狀態(tài)信息設(shè)為私有,并將GPU簇從共享者列表中逐出,同時塊目錄控制單元通知域目錄控制單元作廢GPU二級緩存中的數(shù)據(jù)副本,并將對應(yīng)域目錄項中的GPU計數(shù)器減1,此次請求完成,轉(zhuǎn)2.3;
2.2.1.5、無論讀請求或?qū)懻埱?,若訪問CPU二級緩存缺失,CPU二級緩存將請求同時轉(zhuǎn)發(fā)給域目錄和塊目錄,塊目錄通過塊目錄控制單元向主存申請數(shù)據(jù),接下來根據(jù)域目錄的訪問情況做以下相應(yīng)的處理:若域目錄缺失,轉(zhuǎn)2.2.1.5.1;若域目錄命中,轉(zhuǎn)2.2.1.5.2;
2.2.1.5.1、域目錄控制單元在域目錄陣列中添加目標(biāo)地址對應(yīng)區(qū)域的域目錄項,并將其CPU計數(shù)器加1,然后通知塊目錄控制單元“域目錄訪問缺失”;塊目錄控制單元在收到通知后,等待主存的數(shù)據(jù)響應(yīng),收到主存響應(yīng)的數(shù)據(jù)后將其傳給CPU二級緩存,并在塊目錄陣列中添加目標(biāo)地址的塊目錄項;塊目錄控制單元結(jié)合域目錄控制單元反饋的域目錄缺失信息,按傳統(tǒng)目錄一致性協(xié)議方式處理:即若為寫請求將對應(yīng)塊目錄項的狀態(tài)信息設(shè)為私有,共享者列表設(shè)置為只有CPU簇,此次請求完成,轉(zhuǎn)2.3;若為讀請求將對應(yīng)塊目錄項的狀態(tài)信息設(shè)為共享,共享者列表設(shè)置為只有CPU簇,此次請求完成,轉(zhuǎn)2.3;
2.2.1.5.2、域目錄控制單元向GPU二級緩存發(fā)送目標(biāo)地址的數(shù)據(jù)請求:若GPU二級緩存缺失,轉(zhuǎn)2.2.1.5.2.1;若GPU二級緩存命中,且數(shù)據(jù)非臟時,轉(zhuǎn)2.2.1.5.2.2;若GPU二級緩存命中,且數(shù)據(jù)為臟時,轉(zhuǎn)2.2.1.5.2.3;
2.2.1.5.2.1、若GPU二級緩存缺失,表示GPU沒有目標(biāo)地址的副本,域目錄控制單元將對應(yīng)域目錄項的CPU計數(shù)器加1,并通知塊目錄控制單元“GPU二級緩存缺失”;塊目錄控制單元等待主存的數(shù)據(jù)響應(yīng)并將數(shù)據(jù)轉(zhuǎn)發(fā)給CPU二級緩存;塊目錄控制單元在塊目錄陣列中添加目標(biāo)地址的塊目錄項,按傳統(tǒng)目錄一致性協(xié)議方式處理:即若為寫請求將對應(yīng)塊目錄項的狀態(tài)信息設(shè)為私有,共享者列表設(shè)置為只有CPU簇,此次請求完成,轉(zhuǎn)2.3;若為讀請求將對應(yīng)塊目錄項的狀態(tài)信息設(shè)為共享,共享者列表設(shè)置為只有CPU簇,此次請求完成,轉(zhuǎn)2.3;
2.2.1.5.2.2、若GPU二級緩存的目標(biāo)地址命中且數(shù)據(jù)非臟,域目錄控制單元將域目錄的對應(yīng)域目錄項的CPU計數(shù)器加1,并將GPU二級緩存中的數(shù)據(jù)傳遞給塊目錄控制單元;塊目錄控制單元將最先到達(dá)的數(shù)據(jù)轉(zhuǎn)發(fā)給CPU二級緩存,同時根據(jù)請求類型的不同做以下相應(yīng)的處理:若請求類型為讀請求,轉(zhuǎn)2.2.1.5.2.2.1;若請求類型為寫請求,轉(zhuǎn)2.2.1.5.2.2.2;
2.2.1.5.2.2.1、若請求類型為讀請求,塊目錄控制單元在塊目錄陣列中添加目標(biāo)地址的塊目錄項,按傳統(tǒng)目錄一致性協(xié)議方式處理:即將對應(yīng)塊目錄項狀態(tài)信息設(shè)定為共享,共享者列表設(shè)置為CPU簇加GPU簇,此次請求完成,轉(zhuǎn)2.3;
2.2.1.5.2.2.2、若請求類型為寫請求,域目錄控制單元作廢GPU二級緩存的副本并將對應(yīng)的域目錄項的GPU計數(shù)器減1;塊目錄控制單元在塊目錄陣列中添加目標(biāo)地址的塊目錄項,按傳統(tǒng)目錄一致性協(xié)議方式處理:即將對應(yīng)塊目錄項狀態(tài)信息設(shè)定為私有,共享者列表設(shè)置為只有CPU簇,此次請求完成,轉(zhuǎn)2.3;
2.2.1.5.2.3、若GPU二級緩存的目標(biāo)地址命中且數(shù)據(jù)為臟,域目錄控制單元將GPU二級緩存中請求地址的數(shù)據(jù)轉(zhuǎn)發(fā)給塊目錄控制單元并將對應(yīng)域目錄項的CPU計數(shù)器加1;塊目錄控制單元收到GPU二級緩存的數(shù)據(jù)響應(yīng)后,將數(shù)據(jù)轉(zhuǎn)發(fā)給CPU二級緩存,并寫回主存;然后根據(jù)請求類型的不同,做以下處理:若請求類型為寫請求,轉(zhuǎn)2.2.1.5.2.3.1;若請求類型為讀請求,轉(zhuǎn)2.2.1.5.2.3.2;
2.2.1.5.2.3.1、域目錄控制單元作廢GPU二級緩存的副本并將對應(yīng)的域目錄項的GPU計數(shù)器減1,塊目錄控制單元在塊目錄陣列中添加目標(biāo)地址的塊目錄項,按傳統(tǒng)目錄一致性協(xié)議方式處理:即將對應(yīng)塊目錄項狀態(tài)信息設(shè)定為私有,共享者列表設(shè)置為只有CPU簇,此次請求完成,轉(zhuǎn)2.3;
2.2.1.5.2.3.2、塊目錄控制單元在塊目錄陣列中添加目標(biāo)地址的塊目錄項,按傳統(tǒng)目錄一致性協(xié)議方式處理:即將對應(yīng)塊目錄項狀態(tài)信息設(shè)定為共享,共享者列表設(shè)置為CPU簇加GPU簇,此次請求完成,轉(zhuǎn)2.3;
2.3結(jié)束。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國人民解放軍國防科學(xué)技術(shù)大學(xué),未經(jīng)中國人民解放軍國防科學(xué)技術(shù)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510092458.9/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F15-00 通用數(shù)字計算機
G06F15-02 .通過鍵盤輸入的手動操作,以及應(yīng)用機內(nèi)程序的計算,例如,袖珍計算器
G06F15-04 .在引入被處理的數(shù)據(jù)的同時,進行編制程序的,例如,在同一記錄載體上
G06F15-08 .應(yīng)用插接板編制程序的
G06F15-16 .兩個或多個數(shù)字計算機的組合,其中每臺至少具有一個運算器、一個程序器及一個寄存器,例如,用于數(shù)個程序的同時處理
G06F15-18 .其中,根據(jù)計算機本身在一個完整的運行期間內(nèi)所取得的經(jīng)驗來改變程序的;學(xué)習(xí)機器
- 圖形處理器任務(wù)的分配方法和裝置
- 一種資源調(diào)度裝置、資源調(diào)度系統(tǒng)和資源調(diào)度方法
- 一種免工具GPU支架固定裝置
- 一種YARN集群GPU資源調(diào)度方法、裝置和介質(zhì)
- 一種服務(wù)器內(nèi)4GPU布局結(jié)構(gòu)及其安裝方法
- 一種GPU資源調(diào)度系統(tǒng)及其調(diào)度方法
- 一種GPU拓?fù)浞謪^(qū)方法與裝置
- 一種基于Kubernetes的共享GPU調(diào)度方法
- 一種數(shù)據(jù)處理的方法和裝置
- 一種GPU分配方法、系統(tǒng)、存儲介質(zhì)及設(shè)備





