[發明專利]一種塊大小可變的可重構矩陣寄存器文件有效
| 申請號: | 201010117177.1 | 申請日: | 2010-02-01 |
| 公開(公告)號: | CN101776988A | 公開(公告)日: | 2010-07-14 |
| 發明(設計)人: | 彭元喜;陳書明;劉衡竹;陳海燕;萬江華;劉仲;孫海燕 | 申請(專利權)人: | 中國人民解放軍國防科學技術大學 |
| 主分類號: | G06F9/30 | 分類號: | G06F9/30 |
| 代理公司: | 國防科技大學專利服務中心 43202 | 代理人: | 郭敏 |
| 地址: | 410073湖*** | 國省代碼: | 湖南;43 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 大小 可變 可重構 矩陣 寄存器 文件 | ||
技術領域:本發明涉及向量微處理器中的向量寄存器文件(也稱為矩陣寄存器文件),特別是一種塊大小可變的可重構矩陣寄存器文件。?
背景技術:圖像處理和現代通信等媒體應用領域算法具有大規模并行性,需要進行大量的矩陣運算。而不同算法并行性粒度不同、同一算法在運行的不同階段并行性粒度也不同,在不同算法運行時、算法運行的不同階段所需的數據塊或矩陣塊的大小也不同,這就需要向量寄存器文件的大小和數量在運行不同算法和同一算法運行過程中均可改變。?
面向這類數據密集型應用的向量微處理器通常采用單指令流多數據流SIMD(Single?Instruction?Multiple?Data)、超長指令字體系結構VLIW(VeryLong?Instruction?Words),設置向量運算指令、向量寄存器文件和向量運算陣列來支持矩陣或向量數據運算,以加快數據處理的速度。?
向量指令譯碼部件對向量指令進行譯碼,將譯碼結果發送到向量運算部件和向量寄存器文件。向量運算部件由L(L為正整數,且通常為2的冪)個標量運算單元組成,它按照譯碼結果對來自向量寄存器文件或存儲器的源操作數進行運算,并將運算結果寫入向量寄存器文件或存儲器。?
如圖2公布的,向量寄存器文件由向量寄存器文件主體和讀寫端口組成。向量寄存器文件主體由NR個讀地址譯碼器、NR個讀出緩沖器、NW個寫地址譯碼器以及存儲單元陣列構成,存儲單元陣列由N個行向量寄存器VR0-VRN-1或M個列向量寄存器CVR0-CVRM-1構成,N為行向量寄存器的數目,M為列向量寄存器的數目,存儲單元陣列包含N*M個元素,N和M為正整數且通?常為2的冪,NR、NW均為正整數。存儲單元陣列按行劃分為N個M*B位的存儲單元行,每行由M個元素組成,每個元素的位寬為B。這N個存儲單元行與N個行向量寄存器VR0-VRN-1一一對應,實現行向量寄存器的存取;該存儲單元陣列按列劃分為M個N*B位的存儲單元列,每列由N個同列的元素組成。這M個存儲單元列與M個列向量寄存器CVR0-CVRM-1一一對應,實現列向量寄存器的存取。以CVRM-1為例,該列向量寄存器包括所有行向量寄存器VR0-VRN-1的最后一個元素EM-1。這種支持行列向量訪問的向量寄存器文件不僅可視作由N個行向量寄存器構成,還可視作由M個列向量寄存器構成。?
讀寫端口是向量寄存器文件與向量微處理器中其他部件的接口,它允許向量微處理器中其他部件訪問向量寄存器文件主體存儲的數據。為了支持同時從向量寄存器中獲取多個源操作數和寫入多個目的操作數,向量寄存器文件需要多個讀端口和多個寫端口,而不同讀端口或寫端口之間的訪問相互獨立。因此,現有支持行列向量訪問的向量寄存器文件具有NR個讀端口和NW個寫端口。每個讀端口都由行列選擇信號線、讀地址總線、讀使能信號線以及讀數據總線組成,其中行列選擇信號線用于選擇當前是對行向量寄存器進行讀取還是對列向量寄存器進行讀取,讀地址總線的位寬為MAX(log2?N,log2?M),即log2?N和log2?M兩者的最大值,讀數據總線的位寬為N*B或M*B的最大值。每個寫端口都由行列選擇信號線、寫地址總線、寫使能信號線以及寫數據總線組成,其中行列選擇信號線用于選擇當前是對行向量寄存器進行讀取還是對列向量寄存器進行寫入,寫地址總線的位寬為MAX(log2?N,log2?M),即log2?N和log2?M兩者的最大值,寫數據總線的位寬為N*B或M*B的最大值。?
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國人民解放軍國防科學技術大學,未經中國人民解放軍國防科學技術大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010117177.1/2.html,轉載請聲明來源鉆瓜專利網。





