[發(fā)明專利]用于獨立數(shù)據(jù)上遞歸計算的向量化的讀和寫掩碼更新指令有效
| 申請?zhí)枺?/td> | 201810898049.1 | 申請日: | 2013-06-12 |
| 公開(公告)號: | CN109062608B | 公開(公告)日: | 2023-09-22 |
| 發(fā)明(設(shè)計)人: | M·普羅特尼科夫;A·納賴金;C·休斯 | 申請(專利權(quán))人: | 英特爾公司 |
| 主分類號: | G06F9/30 | 分類號: | G06F9/30 |
| 代理公司: | 上海專利商標(biāo)事務(wù)所有限公司 31100 | 代理人: | 何焜;黃嵩泉 |
| 地址: | 美國加利*** | 國省代碼: | 暫無信息 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 用于 獨立 數(shù)據(jù) 遞歸 計算 量化 掩碼 更新 指令 | ||
本申請公開了用于獨立數(shù)據(jù)上遞歸計算的向量化的讀和寫掩碼更新指令。處理器執(zhí)行掩碼更新指令以執(zhí)行對第一掩碼寄存器和第二掩碼寄存器的更新。處理器內(nèi)的寄存器組包括第一掩碼寄存器和第二掩碼寄存器。處理器包括用于執(zhí)行掩碼更新指令的執(zhí)行電路。響應(yīng)于掩碼更新指令,執(zhí)行電路用于反轉(zhuǎn)第一掩碼寄存器中給定數(shù)量的掩碼位,并且還用于反轉(zhuǎn)第二掩碼寄存器中給定數(shù)量的掩碼位。
本發(fā)明專利申請是國際申請?zhí)枮镻CT/US2013/045505,國際申請日為2013年6月12日,進(jìn)入中國國家階段的申請?zhí)枮?01380045583.3,名稱為“用于獨立數(shù)據(jù)上遞歸計算的向量化的讀和寫掩碼更新指令”的發(fā)明專利申請的分案申請。
技術(shù)領(lǐng)域
本公開涉及處理邏輯、微處理器以及相關(guān)聯(lián)的指令集架構(gòu)的領(lǐng)域,該指令集架構(gòu)在被處理器或其他處理邏輯所執(zhí)行時運行邏輯、數(shù)學(xué)或其他功能性操作。
背景技術(shù)
指令集或指令集架構(gòu)(ISA)是計算機架構(gòu)中與編程有關(guān)的部分,并且可包括原生數(shù)據(jù)類型、指令、寄存器架構(gòu)、尋址模式、存儲器架構(gòu)、中斷和異常處理、以及外部輸入和輸出(I/O)。術(shù)語指令在本申請中一般表示宏指令——宏指令是被提供給處理器(或指令轉(zhuǎn)換器,該指令轉(zhuǎn)換器(例如利用靜態(tài)二進(jìn)制轉(zhuǎn)換、包括動態(tài)編譯的動態(tài)二進(jìn)制轉(zhuǎn)換)轉(zhuǎn)換、變形、仿真或以其他方式將指令轉(zhuǎn)換成將由處理器處理的一個或多個其他指令)以供執(zhí)行的指令——作為對比,微指令或微操作(微ops)是處理器的解碼器解碼宏指令的結(jié)果。
ISA與微架構(gòu)不同,微架構(gòu)是實現(xiàn)該指令集的處理器的內(nèi)部設(shè)計。具有不同微架構(gòu)的處理器可共享共同的指令集。例如,酷睿(CoreTM)處理器、以及來自加利福尼亞州桑尼威爾(Sunnyvale)的超微半導(dǎo)體有限公司(Advanced?Micro?Devices,Inc.)的諸多處理器執(zhí)行幾乎相同版本的x86指令集(在更新的版本中加入了一些擴展),但具有不同的內(nèi)部設(shè)計。例如,可利用公知技術(shù)(包括專用物理寄存器、利用寄存器重命名機制的一個或多個動態(tài)分配的物理寄存器)在不同微架構(gòu)中以不同方式實現(xiàn)該ISA的同一寄存器架構(gòu)。
許多現(xiàn)代ISA支持單指令多數(shù)據(jù)(SIMD)操作。取代僅對一個或兩個數(shù)據(jù)元素進(jìn)行操作的標(biāo)量指令,向量指令(也稱為緊縮數(shù)據(jù)指令或SIMD指令)可同時或并行地對多個數(shù)據(jù)元素或多對數(shù)據(jù)元素進(jìn)行操作。處理器可具有并行的執(zhí)行硬件,以響應(yīng)于該向量指令同時或并行地執(zhí)行多個操作。SIMD操作在一個操作中對緊縮在一個向量寄存器或存儲器位置之內(nèi)的多個數(shù)據(jù)元素進(jìn)行操作。這些數(shù)據(jù)元素被稱為緊縮數(shù)據(jù)或向量數(shù)據(jù)。向量元素中的每一個可表示獨立的單條數(shù)據(jù)(例如像素的顏色,等等),可單獨或與其它數(shù)據(jù)無關(guān)地操作該單條數(shù)據(jù)。
在一些情況下,SIMD操作可以以遞歸方式對獨立向量數(shù)據(jù)元素進(jìn)行操作,其中對于不同數(shù)據(jù)元素,迭代的數(shù)量不同。因此,一些數(shù)據(jù)元素的計算可能完成,而一些其它數(shù)據(jù)元素仍需要更多迭代。遞歸計算的一個示例是WHILE循環(huán)操作。在本示例中,在條件(X[i])為真(滿足)時,對N元素的數(shù)組X[i](i=0,...,N-l)進(jìn)行遞歸計算。當(dāng)條件(X[i])變?yōu)榧贂r,X[i]的計算停止。該條件的示例可以是X[i]0。
for(i=0;iN;i++){
while(條件(X[i])){
X[i]=計算(X[i]);}}
如果對于X[i]的不同數(shù)據(jù)元素,WHILE循環(huán)迭代的數(shù)量不同,則以上計算無法被輕易向量化。一種可能的方法是用處理器在不滿足條件的那些元素上執(zhí)行計算,然后丟棄從這些元素導(dǎo)出的結(jié)果。然而,該方法具有低效率,因為處理器不僅在這些元素上執(zhí)行不必要的計算,而且還無法利用由這些元素占據(jù)的向量寄存器槽口。
附圖說明
在附圖中的諸個圖中通過示例而非限制地示出各個實施例:
圖1是根據(jù)一個實施例的包括向量寄存器和掩碼寄存器的指令處理裝置的框圖。
圖2是根據(jù)一個實施例的寄存器架構(gòu)的框圖。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于英特爾公司,未經(jīng)英特爾公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810898049.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





