[發(fā)明專利]成形的寄存器堆讀取無(wú)效
| 申請(qǐng)?zhí)枺?/td> | 201210567117.9 | 申請(qǐng)日: | 2012-12-24 |
| 公開(公告)號(hào): | CN103257931A | 公開(公告)日: | 2013-08-21 |
| 發(fā)明(設(shè)計(jì))人: | 杰克·希萊爾·肖凱特;邁克爾·費(fèi)特曼;瑟利斯·加德雷;仇小鋼;奧姆卡爾·帕蘭杰佩;阿杰納·拉杰卓;斯圖爾特·格倫·卡爾頓;埃里克·萊爾·希爾;拉杰史沃拉·塞爾瓦桑;道格拉斯·J·哈恩 | 申請(qǐng)(專利權(quán))人: | 輝達(dá)公司 |
| 主分類號(hào): | G06F12/08 | 分類號(hào): | G06F12/08;G06F9/38 |
| 代理公司: | 北京市磐華律師事務(wù)所 11336 | 代理人: | 董巍;徐丁峰 |
| 地址: | 美國(guó)加利*** | 國(guó)省代碼: | 美國(guó);US |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 成形 寄存器 讀取 | ||
1.一種用于實(shí)施寄存器堆的成形的訪問(wèn)的計(jì)算機(jī)實(shí)現(xiàn)的方法,所述寄存器堆包括N個(gè)寄存器的集合,其中N大于或等于2,所述方法包括:
對(duì)于包括在線程組中的至少一個(gè)線程,接收從所述N個(gè)寄存器的集合中的每個(gè)寄存器訪問(wèn)第一數(shù)量的數(shù)據(jù)的請(qǐng)求;以及
配置交叉開關(guān)以允許所述至少一個(gè)線程從所述N個(gè)寄存器的集合中的每個(gè)寄存器訪問(wèn)所述第一數(shù)量的數(shù)據(jù)。
2.根據(jù)權(quán)利要求1所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中所述寄存器堆包括多個(gè)存儲(chǔ)體,并且所述N個(gè)寄存器的集合中的每個(gè)寄存器存在于不同的存儲(chǔ)體中。
3.根據(jù)權(quán)利要求1所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中在每個(gè)時(shí)鐘周期,所述至少一個(gè)線程從以下寄存器訪問(wèn)所述第一數(shù)量的數(shù)據(jù):
所述N個(gè)寄存器的集合中的每個(gè)寄存器,以產(chǎn)生包括所述第一數(shù)量的數(shù)據(jù)的N個(gè)訪問(wèn)的成形的訪問(wèn)操作;
N/2個(gè)對(duì)齊的連續(xù)寄存器對(duì)中的每個(gè)寄存器,以產(chǎn)生包括兩倍于所述第一數(shù)量的數(shù)據(jù)的N/2個(gè)訪問(wèn)的成形的訪問(wèn)操作;或
N/4個(gè)對(duì)齊的四連續(xù)寄存器組中的每個(gè)寄存器,以產(chǎn)生包括四倍于所述第一數(shù)量的數(shù)據(jù)的N/4個(gè)訪問(wèn)的成形的訪問(wèn)操作。
4.根據(jù)權(quán)利要求1所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中所述N個(gè)寄存器的集合包括N/2個(gè)對(duì)齊的連續(xù)寄存器對(duì),并且所述至少一個(gè)線程在單個(gè)時(shí)鐘周期從每個(gè)對(duì)齊的連續(xù)寄存器對(duì)中的每個(gè)寄存器訪問(wèn)所述第一數(shù)量的數(shù)據(jù),以產(chǎn)生包括兩倍于所述第一數(shù)量的數(shù)據(jù)的N/2個(gè)訪問(wèn)的成形的訪問(wèn)操作。
5.根據(jù)權(quán)利要求1所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中所述N個(gè)寄存器的集合包括N/4個(gè)對(duì)齊的四連續(xù)寄存器組,并且所述至少一個(gè)線程在單個(gè)時(shí)鐘周期從每個(gè)對(duì)齊的四連續(xù)寄存器組中的每個(gè)寄存器訪問(wèn)所述第一數(shù)量的數(shù)據(jù),以產(chǎn)生包括四倍于所述第一數(shù)量的數(shù)據(jù)的N/4個(gè)訪問(wèn)的成形的訪問(wèn)操作。
6.根據(jù)權(quán)利要求1所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中第一線程組包括第二線程組的子集并包括包括在所述第二線程組中的連續(xù)的下半部分線程或包括在所述第二線程組中的連續(xù)的上半部分線程。
7.根據(jù)權(quán)利要求1所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中所述至少一個(gè)線程通過(guò)從所述N個(gè)寄存器的集合中的每個(gè)寄存器讀取所述第一數(shù)量的數(shù)據(jù)或?qū)λ鯪個(gè)寄存器的集合中的每個(gè)寄存器寫入所述第一數(shù)量的數(shù)據(jù),來(lái)訪問(wèn)所述第一數(shù)量的數(shù)據(jù)。
8.根據(jù)權(quán)利要求1所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中所述第一數(shù)量的數(shù)據(jù)包括32位的數(shù)據(jù)。
9.一種用于實(shí)施寄存器堆的成形的訪問(wèn)的系統(tǒng),所述寄存器堆包括N個(gè)寄存器的集合,其中N大于或等于2,所述系統(tǒng)包括:
所述寄存器堆;
交叉開關(guān);以及
處理器,配置為:
對(duì)于包括在線程組中的至少一個(gè)線程,接收從所述N個(gè)寄存器的集合中的每個(gè)寄存器訪問(wèn)第一數(shù)量的數(shù)據(jù)的請(qǐng)求;以及
配置所述交叉開關(guān)以允許所述至少一個(gè)線程從所述N個(gè)寄存器的集合中的每個(gè)寄存器訪問(wèn)所述第一數(shù)量的數(shù)據(jù)。
10.根據(jù)權(quán)利要求17所述的系統(tǒng),其中在每個(gè)時(shí)鐘周期,所述至少一個(gè)線程從以下寄存器訪問(wèn)所述第一數(shù)量的數(shù)據(jù):
所述N個(gè)寄存器的集合中的每個(gè)寄存器,以產(chǎn)生包括所述第一數(shù)量的數(shù)據(jù)的N個(gè)訪問(wèn)的成形的訪問(wèn)操作;
N/2個(gè)對(duì)齊的連續(xù)寄存器對(duì)中的每個(gè)寄存器,以產(chǎn)生包括兩倍于所述第一數(shù)量的數(shù)據(jù)的N/2個(gè)訪問(wèn)的成形的訪問(wèn)操作;或
N/4個(gè)對(duì)齊的四連續(xù)寄存器組中的每個(gè)寄存器,以產(chǎn)生包括四倍于所述第一數(shù)量的數(shù)據(jù)的N/4個(gè)訪問(wèn)的成形的訪問(wèn)操作。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于輝達(dá)公司,未經(jīng)輝達(dá)公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210567117.9/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類





