[發(fā)明專利]一種處理器裝置及其循環(huán)處理方法有效
| 申請?zhí)枺?/td> | 201110319091.1 | 申請日: | 2011-10-19 |
| 公開(公告)號: | CN102508635A | 公開(公告)日: | 2012-06-20 |
| 發(fā)明(設(shè)計)人: | 張鐵軍;王東輝;王琪;洪纓;侯朝煥 | 申請(專利權(quán))人: | 中國科學院聲學研究所 |
| 主分類號: | G06F9/30 | 分類號: | G06F9/30 |
| 代理公司: | 北京億騰知識產(chǎn)權(quán)代理事務(wù)所 11309 | 代理人: | 陳霽 |
| 地址: | 100190 *** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 處理器 裝置 及其 循環(huán) 處理 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及一種處理器技術(shù),尤其涉及一種處理器裝置及其循環(huán)處理方法。
背景技術(shù)
隨著計算機和信息技術(shù)的飛速發(fā)展,數(shù)字信號處理(Digital?Signal?Processing,DSP)技術(shù)應(yīng)運而生并得到迅速的發(fā)展。DSP處理器則廣泛的應(yīng)用于數(shù)據(jù)密集型計算類應(yīng)用,如圖像、視頻編碼等。這些應(yīng)用的計算復(fù)雜性和實時性特點對處理器的性能提出了更高的要求。而這些應(yīng)用大部分計算都集中在循環(huán)以及循環(huán)嵌套中完成。
在DSP的應(yīng)用中,如果DSP處理器能夠?qū)崿F(xiàn)零開銷循環(huán),將可以大大提高DSP處理器的性能。所謂零開銷循環(huán)是DSP處理器在執(zhí)行循環(huán)時,不用花時間去檢查循環(huán)計數(shù)器的值就能執(zhí)行一組指令,由硬件完成循環(huán)跳轉(zhuǎn)和循環(huán)計數(shù)器的增減。
現(xiàn)有的零循環(huán)開銷技術(shù)大多不支持超長指令字(Very?Long?Instruction?Word,VLIW)結(jié)構(gòu)的DSP處理器,而且增加的循環(huán)指令眾多,硬件實現(xiàn)方法復(fù)雜。所支持的循環(huán)體內(nèi)指令數(shù)目和循環(huán)次數(shù)有限,循環(huán)的控制不能完全由硬件實現(xiàn),循環(huán)開銷依然存在。
如2010年12月6-8號在成都舉辦的第18屆智能信號處理與通信系統(tǒng)國際會議(ISPACS)上Zhenqi?Wei,Peilin?Liu,Ji?Kong,Rendong?Ying等人發(fā)表的《Low-Power?Microarchitecture?of?Zero-Overhead?Nested?Loops?in?Embedded?Processors》文章中公開了通過增加專用的循環(huán)指令:LOOP.C,LOOP.B,LOOP.R,LOOP.BR來通知硬件接下來循環(huán)體的指令數(shù)目和循環(huán)次數(shù),或者刷新硬件中循環(huán)計數(shù)器等專用寄存器的值。通過增加硬件單元,包括一個循環(huán)寄存器堆棧和循環(huán)緩存器,其中循環(huán)寄存器堆棧用于存儲循環(huán)體的起始地址、結(jié)束地址、當前循環(huán)PC、循環(huán)次數(shù)和循環(huán)體是否可用、是否使用循環(huán)緩沖的標志位,循環(huán)緩存器用于存儲小循環(huán)的循環(huán)指令。文章所公開的方法雖然能較好的解決零循環(huán)開銷的問題,但是增加的指令較多,雖然文章提出其支持循環(huán)嵌套,但是沒有提出具體的硬件實現(xiàn)方式。而且該方法只適用于單發(fā)射的DSP處理器結(jié)構(gòu),不適用于具有VLIW結(jié)構(gòu)的高性能DSP處理器。
如計算機期刊IEEE?Transactions?on?computers,Vol?57,NO.2,F(xiàn)ebruary?2008中Nikolaos?Kavvadias?and?Spirdon?Nikoladis等人發(fā)表的《Elimination?of?overhead?operations?in?complex?loop?structures?for?embedded?microprocessors》文章中提到通過任務(wù)控制循環(huán)圖(Task?Control-flow?Graph,TCFG)優(yōu)化應(yīng)用程序的循環(huán)節(jié)點,編譯產(chǎn)生優(yōu)化后的代碼。增加的循環(huán)硬件模塊包括:循環(huán)參數(shù)表、索引計算單元和任務(wù)選擇單元。可以支持循環(huán)嵌套,以及多入口和多出口循環(huán)。多入口和多出口循環(huán)主要用于控制密集型循環(huán),而大多數(shù)程序的計算密集型循環(huán)控制邏輯簡單,不存在多入口和多出口。而且這種方法只支持單發(fā)射的處理器結(jié)構(gòu),而且不能被傳統(tǒng)編譯器優(yōu)化,硬件結(jié)構(gòu)復(fù)雜。
如德州儀器(Texas?Instruments,TI)公司DSP芯片C64X+系列支持VLIW,主要采用軟件流水機制減少循環(huán)開銷。硬件部分包括1個緩沖器和兩個計數(shù)器,另外還有7條相關(guān)指令。其中,緩沖器可以用來存儲最多14個指令執(zhí)行包的循環(huán)體代碼,使得循環(huán)時不用每次訪問內(nèi)存重新取值,節(jié)省功耗和存儲訪問帶寬。在程序編譯過程中,編譯器會自動將可以放入緩沖器的循環(huán)指令用特殊指令標識,用MVC指令將循環(huán)次數(shù)裝載到內(nèi)部循環(huán)計數(shù)器,循環(huán)代碼的開始和結(jié)束分別用指令SPLOOP和SPKERNEL指令標識。這樣循環(huán)體執(zhí)行結(jié)束時,其硬件機制可以控制代碼從循環(huán)體開始處繼續(xù)執(zhí)行,減少了分支指令的開銷。但是該方法中,對計數(shù)器的寫入和讀取,循環(huán)體的開始和結(jié)束都需要通過指令實現(xiàn),浪費指令周期。循環(huán)次數(shù)由循環(huán)計數(shù)器的值決定,而且從加載循環(huán)計數(shù)器值到它的內(nèi)容可以使用需要4個時鐘周期,因而要求在SPLOOP指令前4個周期加載循環(huán)計數(shù)器。這種方法對指令順序要求嚴格,而且這4個周期的間隔通道需要通過插入空指令來實現(xiàn),浪費指令周期。
發(fā)明內(nèi)容
本發(fā)明的目的是通過在超長指令字的處理器中增加一條指令和一個循環(huán)單元,解決超長指令字的處理器循環(huán)控制不能完全由硬件實現(xiàn),循環(huán)執(zhí)行開銷大的問題。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國科學院聲學研究所,未經(jīng)中國科學院聲學研究所許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110319091.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





