[發明專利]用于眾核處理的快速同步屏障的技術有效
| 申請號: | 201580061900.X | 申請日: | 2015-11-11 |
| 公開(公告)號: | CN107209698B | 公開(公告)日: | 2020-09-29 |
| 發明(設計)人: | A·D·羅賓森 | 申請(專利權)人: | 英特爾公司 |
| 主分類號: | G06F9/52 | 分類號: | G06F9/52 |
| 代理公司: | 上海專利商標事務所有限公司 31100 | 代理人: | 姬利永 |
| 地址: | 美國加利*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 處理 快速 同步 屏障 技術 | ||
用于多線程化同步的技術包括具有眾核處理器的計算設備。每個處理器核包括多個硬件線程。由處理器核執行的硬件線程進入同步屏障并與由同一處理器核執行的其他硬件線程同步。在同步之后,所述硬件線程與可能由不同處理器核執行的源硬件線程同步。可以利用所有硬件線程的n路混洗來分配所述源硬件線程,其中,n是每個處理器核的硬件線程數。所述硬件線程與由同一處理器核執行的其他硬件線程重新同步。所述硬件線程與所述源硬件線程以及由同一處理器核執行的所述其他硬件線程交替同步,直到所有硬件線程都已同步。所述計算設備可以降低在所述同步屏障以上的布爾值。本文還描述和請求了其他實施例。
相關美國專利申請的交叉引用
本申請要求于2014年12月3日提交的題為“TECHNOLOGIES FOR FASTSYNCHRONIZATION BARRIERS FOR MANY-CORE PROCESSING(用于眾核處理的快速同步屏障的技術)”的美國實用新型專利申請序列號14/568,890的優先權。
技術背景
對于當前的計算設備和應用程序,高效的多線程性能正變得越來越重要。OpenMP是一種用于共享內存并行編程的流行應用程序編程接口(API)。OpenMP指定了可以用于協調在線程隊(thread team)中執行的多個線程的同步屏障特征。一般地,在對程序的執行可以進行之前,線程隊的所有線程必須到達屏障。OpenMP還指定了其中多個線程可以創建和執行任務的任務系統。必須在線程可能退出同步屏障之前完成所有任務。因此,通常在線程在同步屏障中等待的同時執行任務。
通常通過使線程以某種方式彼此等待來實現同步屏障。例如,在樹形屏障中,線程以樹形模式彼此等待,從葉子開始并扇入直達根部,然后反向從根部朝向葉子向下扇出。作為另一個示例,在分級屏障中,線程還以樹模式彼此等待,但由相同處理器核執行的線程被分組為在樹中彼此靠近的葉節點。作為第三個示例,在傳播屏障中,線程以本質上形成一組交疊樹的更復雜的模式彼此等待。在基于高速緩存的處理器架構中,完成屏障運算所需的時間可以由各個線程在所述線程與其他線程通信而穿過同步屏障時引發的高速緩存未命中(cache miss)的數量來支配或限制。
附圖簡述
在附圖中通過示例的方式而非限制性的方式展示了在此所描述的概念。為了說明的簡單和清晰起見,附圖中所展示的元件不一定按比例繪制。在認為適當的情況下,在附圖當中重復參考標號以表示相應或相似的元件。
圖1是用于快速多線程化同步的計算設備的至少一個實施例的簡化框圖;
圖2是可以由圖1的計算設備建立的環境的至少一個實施例的簡化框圖;
圖3A和圖3B是可以由圖1和圖2的計算設備執行的用于快速多線程化同步的方法的至少一個實施例的簡化流程圖;以及
圖4是展示了可以由圖1和圖2的計算設備建立的屏障通信網絡的示意圖;
圖5A-5C是展示了可以由圖1和圖2的計算設備執行的用于快速多線程化同步的方法的至少一個實施例的偽代碼。
具體實施方式
雖然本公開的概念易于經歷各種修改和替代形式,但是在附圖中已經通過示例的方式示出了其特定實施例并且將在此對其進行詳細描述。然而,應當理解的是,并不旨在將本公開的概念限制于所公開的特定形式,而相反,意圖是覆蓋與本公開和所附權利要求書一致的所有修改型式、等效型式和替代型式。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于英特爾公司,未經英特爾公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201580061900.X/2.html,轉載請聲明來源鉆瓜專利網。





