[發明專利]運算和控制單元、運算和控制方法、與并行處理器有效
| 申請號: | 201210252648.9 | 申請日: | 2012-07-20 |
| 公開(公告)號: | CN102890625B | 公開(公告)日: | 2017-03-01 |
| 發明(設計)人: | 京昭倫 | 申請(專利權)人: | 瑞薩電子株式會社 |
| 主分類號: | G06F9/38 | 分類號: | G06F9/38;G06F9/30 |
| 代理公司: | 中原信達知識產權代理有限責任公司11219 | 代理人: | 李蘭,孫志湧 |
| 地址: | 日本*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 運算 控制 單元 方法 并行 處理器 | ||
相關申請的交叉引用
于2011年7月20日提交的日本專利申請No.2011-159396的公開內容,包括說明書、附圖和摘要,通過引用其整體而合并于此。
技術領域
本發明涉及并行處理器的運算和控制技術。
背景技術
近些年來,因為需要抑制處理器發熱,存在明顯的趨勢:通過增加進行并行處理的處理器核(以下僅稱為“核”)的數量而不是增大處理器的操作頻率來實現性能上的改善。其中每一個具有多個核的處理器被稱為“多核處理器”,并且,在多核處理器中,其中每一個具有特別大量的核的處理器被稱為“眾核處理器”。在本說明書中,在多核處理器和眾核處理器之間不特別區分,并且其中每一個具有并行進行處理的多個核的處理器通常被稱為“并行處理器”。
并行處理器已經在大量的領域中被用作加速器。然而,已經取決于制造商或領域而制造了多種加速器,并且也已經不同地開發了用于加速器的語言和框架。這使得難以在加速器之間移植程序代碼。
為了解決這個問題,將OpenCL(開放計算語言)確定為用于并行處理器的標準框架(OpenCL規范,版本:1.0,修訂文件:43,Khronos?OpenCL工作組(2009))。將描述OpenCL的概覽。
圖19圖示了典型的OpenCL系統的平臺模型,其中,對于“OpenCL規范,版本:1.0,修訂文件:43,Khronos?OpenCL工作組(2009)”中的圖3.1添加了附圖標號。
如圖19中所示,OpenCL系統10包括主機12和一個或多個計算設備(以下稱為“OpenCL設備”)14。OpenCL設備14對應于上述的加速器。
OpenCL設備14的每一個具有一個或多個計算單元(以下稱為“CU”)16,并且CU16的每一個具有一個或多個處理元件(以下稱為“PE”)18。PE18對應于上述的核。
OpenCL的應用包括在主機12側運行的程序代碼和在OpenCL設備14中、即在加速器側運行的程序代碼。在主機12側運行的程序代碼被稱為“主機代碼”,并且在OpenCL設備14側運行的程序代碼被稱為“內核”。
主機12調用用于運算的指令的API(應用程序接口)。OpenCL設備14的每一個執行所指令的運算。主機12產生用于管理資源的環境,并且也產生用于通過OpenCL來調整設備操作的命令隊列。“設備操作”包括運算、存儲器的操作以及同步。
在OpenCL中,在N維索引空間(1≤N≤3)中執行內核作為工作項目(以下簡稱為“項目”)。例如,如果將(4,6)被指定為二維索引空間,則總共執行4×6、24個項目。
將一個PE用于一個項目的執行。因此,如果要并行執行的項目的數量與對于該項目實際上存在的PE的數量相同,則總共在4×6、24個PE上執行該內核。
如果存在的PE的數量小于要并行執行的項目的數量,則在存在的PE上重復該項目的并行執行。如果例如僅存在總共2×3、6個PE,則當指定上述的(4,6)的索引空間時,必須通過6個PE將6個項目的并行執行重復4次。
而且,在OpenCL中,引入工作組的概念。工作組是在同一CU?16上執行并且彼此相關聯的項目的集合。在同一工作組內的相應的項目執行同一內核,并且共享CU?16的本地存儲器,這將在下文描述。
向相應的工作組分配唯一的組ID,并且在每一個工作組內的項目具有在工作組內向其分配的唯一的本地ID。也向項目分配唯一的全局ID。可以通過全局ID或組ID與本地ID的組合來識別項目。
通過以下面的步驟順序調用API來配置用于允許OpenCL設備14進行運算處理的過程。
<步驟1>:從OpenCL設備14的主機12傳送用于運算處理的參考數據(以下稱為“參考數據”)和內核。
<步驟2>:響應于“內核開始命令”在OpenCL設備14的每一個上開始執行內核。
<步驟3>:在OpenCL設備14中完成內核的執行后,將運算處理的結果數據從OpenCL設備14的存儲器空間傳送到主機12側。
將參考圖20來描述包括存儲器空間的OpenCL設備14的配置。在圖20中,對于“OpenCL規范,版本:1.0,修訂文件:43,KhronosOpenCL工作組(2009)”中的圖3.3添加了附圖標號。如上所述,OpenCL設備14的每一個包括一個或多個CU?16,并且CU?16的每一個具有一個或多個PE?18。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于瑞薩電子株式會社,未經瑞薩電子株式會社許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210252648.9/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種高壓電纜頭中間芯線的處理方法
- 下一篇:一種管狀母線等電位作業的方法





