[發明專利]用于SIMD結構化分支的方法和裝置有效
| 申請號: | 201580044432.5 | 申請日: | 2015-09-10 |
| 公開(公告)號: | CN106662999B | 公開(公告)日: | 2020-05-12 |
| 發明(設計)人: | 蘇布拉馬尼亞姆·梅尤拉恩;達林·M·斯塔基;托馬斯·A·皮亞扎 | 申請(專利權)人: | 英特爾公司 |
| 主分類號: | G06F9/38 | 分類號: | G06F9/38 |
| 代理公司: | 北京東方億思知識產權代理有限責任公司 11258 | 代理人: | 宗曉斌 |
| 地址: | 美國加利*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 simd 結構 化分 方法 裝置 | ||
用于SIMD結構化分支的方法和裝置。例如,處理器的一個實施例包括具有多個通道的執行單元,該執行單元執行指令;以及分支單元,該分支單元處理控制流指令并維護針對每個通道的每通道計數和針對控制流指令的控制指令計數,該分支單元至少基于每通道計數來啟用和禁用通道。
技術領域
本發明一般涉及計算機處理器領域。更具體地,本發明涉及用于執行單指令多數據(SIMD)結構化分支的裝置和方法。
背景技術
在單指令多數據(SIMD)程序中管理控制流是一個復雜的問題。傳統上,圖形處理單元(GPU)使用標量代碼和程序例程來控制針對每個SIMD通道的指令指針(IP)地址。這在性能和功率使用方面都是低效的。
在一些架構上通過針對每個通道維持唯一的IP地址來管理控制流。例如,當遇到控制流指令時,用基于該指令的謂詞掩碼的特定IP來更新每個通道的IP。對于各個指令,將執行IP與通道的IP進行比較以確定該通道是否針對在當前IP處的特定指令被啟用。
附圖說明
通過以下結合附圖的詳細描述可以更好地理解本發明,其中:
圖1是帶有具有一個或多個處理器核和圖形處理器的處理器的計算機系統的實施例的框圖;
圖2是具有一個或多個處理器核、集成存儲器控制器和集成圖形處理器的處理器的一個實施例的框圖;
圖3是圖形處理器的一個實施例的框圖,該圖形處理器可以是離散圖形處理單元或者可以是與多個處理核集成的圖形處理器;
圖4是圖形處理器的圖形處理引擎的實施例的框圖;
圖5是圖形處理器的另一實施例的框圖;
圖6是包括處理元件陣列的線程執行邏輯的框圖;
圖7示出了根據實施例的圖形處理器執行單元指令格式;
圖8是包括圖形管線、媒體管線、顯示引擎、線程執行邏輯和渲染輸出管線的圖形處理器的另一實施例的框圖;
圖9A是示出根據實施例的圖形處理器命令格式的框圖;
圖9B是示出根據實施例的圖形處理器命令序列的框圖;
圖10示出了根據實施例的用于數據處理系統的示例性圖形軟件架構;
圖11示出了用于執行SEVID分支操作的系統架構的一個實施例;
圖12示出了根據本發明的一個實施例的分支單元;
圖13示出了根據本發明的一個實施例的用于處理發散控制流指令的方法;以及
圖14示出了根據本發明的一個實施例的用于處理收斂控制流指令的方法。
具體實施方式
在下面的描述中,出于說明的目的,闡述了許多具體細節以便提供對下面描述的本發明的實施例的透徹理解。然而,對于本領域技術人員清楚的是,可以在沒有這些具體細節中的一些細節的情況下實踐本發明的實施例。在其他實例中,以框圖形式示出了公知的結構和設備,以避免模糊本發明的實施例的基本原理。
示例性圖形處理器架構和數據類型
圖1是根據實施例的數據處理系統100的框圖。數據處理系統100包括一個或多個處理器102和一個或多個圖形處理器108,并且可以是單處理器臺式系統、多處理器工作站系統或具有大量處理器102或處理器核107的服務器系統。在實施例中,數據處理系統100是用于移動、手持或嵌入式設備中的片上系統(SOC)集成電路。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于英特爾公司,未經英特爾公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201580044432.5/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:數據存儲的跳過
- 下一篇:處理器和用于處理器中的中斷處理的方法





