[發(fā)明專利]一種片上帶寬動態(tài)分配方法及系統(tǒng)有效
| 申請?zhí)枺?/td> | 202011134155.6 | 申請日: | 2020-10-21 |
| 公開(公告)號: | CN112311695B | 公開(公告)日: | 2022-09-30 |
| 發(fā)明(設計)人: | 范志華;歐焱;吳欣欣;李文明;安學軍;葉笑春;范東睿 | 申請(專利權)人: | 中國科學院計算技術研究所 |
| 主分類號: | H04L47/52 | 分類號: | H04L47/52;H04L47/76;H04L49/109 |
| 代理公司: | 北京律誠同業(yè)知識產權代理有限公司 11006 | 代理人: | 祁建國 |
| 地址: | 100080 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 帶寬 動態(tài)分配 方法 系統(tǒng) | ||
本發(fā)明提出一種片上帶寬動態(tài)分配方法和系統(tǒng),包括:發(fā)射模塊接受存儲系統(tǒng)的任務請求,將請求封裝為發(fā)射塊,將多個發(fā)射塊組織為堆結構,動態(tài)維護堆結構,向分配模塊傳輸發(fā)射塊;分配模塊由帶窗口的隊列組成,其功能為接受發(fā)射塊,為發(fā)射塊匹配等待隊列,更新發(fā)射塊內容并將其回傳存儲系統(tǒng);每個寬度的帶寬對應一個等待隊列,等待隊列中是需要傳輸?shù)臄?shù)據(jù)。本發(fā)明采用硬件與軟件協(xié)同的方式帶寬分配方法,可以提高帶寬的利用率,增加芯片的吞吐率,實現(xiàn)高通量的計算需求;本發(fā)明控制邏輯、結構簡單,不占用計算資源,實現(xiàn)簡單,在多種芯片系統(tǒng)中具有普適性。
技術領域
本發(fā)明涉及計算機體系結構領域,尤其涉及一種片上帶寬動態(tài)分配方法及系統(tǒng)。
背景技術
隨著摩爾定律和半導體工藝的發(fā)展,在多處理器芯片或加速器中,帶寬成了限制芯片系統(tǒng)運算能力提升的重要因素。芯片內各個部件之間通過總線進行數(shù)據(jù)與控制信號傳輸,受成本與工藝的制約,芯片的總線帶寬不能無線擴大,那么如何高效利用有限的帶寬,為每個處理器提供充足的數(shù)據(jù),從而充分發(fā)揮多處理器系統(tǒng)的性能,成為一個研究的熱點問題值。
大數(shù)據(jù)、人工智能等應用程序往往具有強實時性、高通量的特征,即提高單位時間內處理的任務數(shù)量,這對芯片的傳輸系統(tǒng)提出了更高的要求。本發(fā)明提供一種片上帶寬動態(tài)分配方法與系統(tǒng),目的是充分利用片上有限的帶寬,增大帶寬利用率。
現(xiàn)有的技術主要有以下幾類:
第一類是通過不同的算法或者方法對每個任務增加一個優(yōu)先級標簽,然后根據(jù)任務的優(yōu)先級由高到低依次獲得帶寬,進行數(shù)據(jù)傳輸。此類技術存在的缺點有:首先,優(yōu)先級較低的任務可能會長時間無法獲得帶寬,導致處理該任務的處理器處于長時間等待狀態(tài);其次,該類方法屬于靜態(tài)帶寬調度方法,在多處理器系統(tǒng)中,很難滿足復雜的任務傳輸需求,比如可能因為一個處理器的長時間占用帶寬傳輸導致其他處理器等待的情況,不具有靈活性。
第二類是對第一類技術的進一步優(yōu)化,解決了帶寬在某一時刻只由一個任務占用的不足。該類方法允許同一時刻可由多個任務同時占用帶寬。此類問題的不足在于:首先,此類技術仍屬于軟件層面的優(yōu)化,求解最優(yōu)化問題,速度慢且占用運算資源;再者,優(yōu)先級較低的任務可能會長時間無法獲得帶寬;其次,此類技術會造成對帶寬的浪費與閑置,比如優(yōu)先級較高的任務,但是其傳輸量很小,造成某部分帶寬被閑置,造成資源的浪費。
系統(tǒng)吞吐量=完成任務數(shù)/時間;
帶寬利用率=實際傳輸帶寬/理想帶寬;
發(fā)明內容
本發(fā)明的目的是解決上述現(xiàn)有技術的高寬利用率低、系統(tǒng)吞吐量低的問題,例如現(xiàn)有技術帶寬并未充分利用,若芯片硬件的帶寬可以達到16GB/s的帶寬,在使用的時候由于調度的問題,可能每秒只能傳輸10GB的數(shù)據(jù),也就是實際的帶寬為10GB/s,浪費了6GB/s的帶寬。本發(fā)明提供一種動態(tài)帶寬分配方法,該方法能夠充分利用有效帶寬,提高帶寬的利用率。
針對現(xiàn)有技術的不足,本發(fā)明提出一種片上帶寬動態(tài)分配方法,其中包括:
步驟1、根據(jù)預設粒度,將芯片的總線帶寬劃分為多個具有不同帶寬的子帶寬,并為每個子帶寬建立獨立的等待隊列;
步驟2、存儲系統(tǒng)將需要傳輸?shù)娜蝿站幪柡推鋵臄?shù)據(jù)量傳輸至發(fā)射模塊;
步驟3、發(fā)射模塊組合該任務編號和該數(shù)據(jù)量得到發(fā)射塊,并將該發(fā)射塊存入發(fā)射堆,將位于該發(fā)射堆堆頂?shù)陌l(fā)射塊送到分配模塊進行帶寬分配;
步驟4、發(fā)配模塊判斷當前發(fā)射塊中的當前數(shù)據(jù)量大小是否等于某一子帶寬寬度,若是則將子帶寬的等待隊列序號寫入發(fā)射塊中,執(zhí)行步驟5,否則將與當前數(shù)據(jù)量最接近的子帶寬寬度的等待隊列序號寫入發(fā)射塊中,并通過當前數(shù)據(jù)量減去最接近的子帶寬寬度更新該當前數(shù)據(jù)量,循環(huán)步驟4直到發(fā)射塊中數(shù)據(jù)量均被分配等待隊列序號執(zhí)行步驟5;
步驟5、存儲系統(tǒng)將任務數(shù)據(jù)根據(jù)對應的等待隊列序號送入等待隊列進行傳輸。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院計算技術研究所,未經中國科學院計算技術研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011134155.6/2.html,轉載請聲明來源鉆瓜專利網。





