[發明專利]提供向量壓縮和旋轉功能的指令和邏輯有效
| 申請號: | 201310524909.2 | 申請日: | 2013-10-30 |
| 公開(公告)號: | CN103793201B | 公開(公告)日: | 2017-08-11 |
| 發明(設計)人: | T·烏利爾;E·烏爾德-艾哈邁德-瓦勒;R·瓦倫丁 | 申請(專利權)人: | 英特爾公司 |
| 主分類號: | G06F9/30 | 分類號: | G06F9/30;G06F9/38 |
| 代理公司: | 永新專利商標代理有限公司72002 | 代理人: | 王英,張立達 |
| 地址: | 美國加*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 提供 向量 壓縮 旋轉 功能 指令 邏輯 | ||
技術領域
本公開涉及處理邏輯、微處理器和相關聯的指令集架構的領域,當由所述處理器或其它處理邏輯執行時,所述相關聯的指令集架構執行邏輯、算術或其它功能操作。具體地說,本公開涉及用于提供向量壓縮和旋轉功能的指令和邏輯。
背景技術
現代處理器經常包括用于提供操作的指令,這些操作是計算密集的,但是提供能夠經過使用例如以單指令多數據(SIMD)向量寄存器為例的各種數據存儲設備的有效實現來開發的高級數據并行性。中央處理單元(CPU)可以然后提供并行硬件以支持處理向量。向量是保持多個連續數據元素的數據結構。具有尺寸M的向量寄存器可以包含具有尺寸O的N個向量元素,其中N=M/O。例如,可以將64字節向量寄存器劃分為(a)64個向量元素,每一個元素保持占據1個字節的數據項,(b)32個向量元素以保持每一個占據2個字節(或一個“字”)的數據項,(c)16個向量元素以保持每一個占據4個字節(或一個“雙字”)的數據項,或(d)8個向量元素以保持每一個占據8個字節(或一個“四倍字”)的數據項。
使應用或軟件代碼向量化可以包括使應用在例如以寬的或大的寬度向量架構為例的特定系統或指令集架構上編譯、安裝和/或運行。
計算行業發展了各種編程基準以測試架構和諸如向量化、同時多線程、預測等等的計算技術的效率。一組這樣的基準來自標準性能評估公司(SPEC)。SPEC基準廣泛用于“檢測”處理器和平臺架構的性能。構成SPEC基準的程序由行業專業人員進行描繪和分析,試圖發現新的編譯和計算技術以改善計算機性能。被稱為CPU2006的SPEC基準組之一包括被選擇以強調系統的處理器、存儲器子系統和編譯器的整數和浮點CPU密集的基準。CPU2006包括根據NAMD的數據布局和內環推導的被稱為444.NAMD的程序,一種用于模擬由伊利諾伊大學厄巴納-尚佩恩分校的理論和計算生物組的Jim Phillips開發的大生物分子系統的并行程序。將NAMD的幾乎所有運行時間都花費在計算小組功能中的原子間交互上。這一組與大量代碼分離以形成對于CPU2006的緊湊基準。計算核心在寬范圍的機器架構上實現良好的性能,但是不包含平臺特定的優化。
程序NAMD是2002年Gordon Bell并行可擴展性獎金的獲勝者,但是串行性能同樣重要。在人們例如對基準的大多數并行部分中的全部進行向量化之后,不可向量化的串行部分典型地代表基準的運行時間的甚至更顯著的部分。這一情況是對于具有高并行可擴展性的計算密集程序的通常情況的典型示例。在使用向量化來加速大多數并行部分之后,還存在移除性能限制問題和瓶頸以改善程序的另外的不可向量化或串行部分的性能的艱難工作。
目前為止,還沒有充分探究對于這樣的性能限制問題和瓶頸的潛在解決方案。
附圖說明
在附圖中通過示例而非限制的方式說明了本發明。
圖1A是執行用于提供向量壓縮和旋轉功能的指令的系統的一個實施例的方框圖。
圖1B是執行用于提供向量壓縮和旋轉功能的指令的系統的另一實施例的方框圖。
圖1C是執行用于提供向量壓縮和旋轉功能的指令的系統的另一實施例的方框圖。
圖2是執行用于提供向量壓縮和旋轉功能的指令的處理器的一個實施例的方框圖。
圖3A說明了根據一個實施例的壓縮數據類型。
圖3B說明了根據一個實施例的壓縮數據類型。
圖3C說明了根據一個實施例的壓縮數據類型。
圖3D說明了根據一個實施例用于提供向量壓縮和旋轉功能的指令編碼。
圖3E說明了根據另一實施例用于提供向量壓縮和旋轉功能的指令編碼。
圖3F說明了根據另一實施例用于提供向量壓縮和旋轉功能的指令編碼。
圖3G說明了根據另一實施例用于提供向量壓縮和旋轉功能的指令編碼。
圖3H說明了根據另一實施例用于提供向量壓縮和旋轉功能的指令編碼。
圖4A說明了用于執行提供向量壓縮和旋轉功能的指令的處理器微架構的一個實施例的元素。
圖4B說明了用于執行提供向量壓縮和旋轉功能的指令的處理器微架構的另一實施例的元素。
圖5是執行提供向量壓縮和旋轉功能的指令的處理器的一個實施例的方框圖。
圖6是執行提供向量壓縮和旋轉功能的指令的計算機系統的一個實施例的方框圖。
圖7是執行提供向量壓縮和旋轉功能的指令的計算機系統的另一實施例的方框圖。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于英特爾公司,未經英特爾公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310524909.2/2.html,轉載請聲明來源鉆瓜專利網。





