[發明專利]用于多精度算術的SIMD整數乘法累加指令有效
| 申請號: | 201710330038.9 | 申請日: | 2011-12-19 |
| 公開(公告)號: | CN107368286B | 公開(公告)日: | 2020-11-06 |
| 發明(設計)人: | V·戈帕爾;G·M·沃爾里齊;E·奧茲圖科;J·D·吉爾福德;K·S·雅普;S·M·格爾雷;W·K·費格哈利;M·G·迪克森 | 申請(專利權)人: | 英特爾公司 |
| 主分類號: | G06F9/30 | 分類號: | G06F9/30;G06F9/38 |
| 代理公司: | 上海專利商標事務所有限公司 31100 | 代理人: | 何焜 |
| 地址: | 美國加利*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 精度 算術 simd 整數 乘法 累加 指令 | ||
本申請公開了用于多精度算術的SIMD整數乘法累加指令。乘法和累加(MAC)指令允許無符號的整數乘法的高效執行。MAC指令指示第一向量寄存器作為第一操作數、第二向量寄存器作為第二操作數和第三向量寄存器作為目的地。第一向量寄存器存儲第一因數,且第二向量寄存器存儲部分和。執行MAC指令以將第一因數與隱含的第二因數相乘以生成乘積,并且將部分和與乘積相加以生成結果。第一因數、隱含的第二因數以及部分和具有相同的數據寬度,且乘積具有兩倍的數據寬度。將結果的最高有效半部分存儲在第三向量寄存器中,且將結果的最低有效半部分存儲在第二向量寄存器中。
本發明專利申請是國際申請號為PCT/US2011/065901,國際申請日為 2011年12月19日,進入中國國家階段的申請號為201180076397.7,名稱為“用于多精度算術的SIMD整數乘法累加指令”的發明專利申請的分案申請。
技術領域
本發明的實施例一般涉及計算機處理器架構,更具體而言,涉及當被執行時導致特定結果的指令。
相關技術的描述
許多處理器具有單指令多數據(SIMD)架構。該SIMD架構通常有助于顯著提高處理速度。在SIMD架構中,與僅在一個數據元素或一對數據元素上操作的標量指令不同,向量指令(也稱為打包數據指令或SIMD指令) 可在多個數據元素、或多對數據元素上同時和/或并行地操作。處理器可具有并行執行硬件,該并行執行硬件響應于向量指令來同時或并行地執行多個操作。
在SIMD架構中,可將多個數據元素打包在一個寄存器或存儲器位置內作為打包數據或向量數據。在向量數據中,寄存器或其他存儲位置的位可被邏輯地劃分成多個固定大小的數據元素的序列。數據元素中的每一個可表示個體數據片,該個體數據片連同通常具有相同大小的其他數據元素一起被存儲在寄存器或存儲位置中。例如,256位寬寄存器可具有四個64位寬向量元素,八個 32位寬向量元素,十六個16位寬向量元素,或三十二個8位寬向量元素。每一個向量元素可表示獨立的個體數據片段,可與其它數據片斷分開地或獨立地在該數據片段上操作。
代表性地,向量加法指令可以指定在來自兩個源向量操作數的所有相應數據元素對上執行單個向量操作(例如,加法)以生成目的或結果向量。這些源向量操作數是相同大小,可包含相同寬度的數據元素,如此,可各自包含相同數量的數據元素。兩個源向量操作數中的相同的位位置中的源數據元素可以表示相應的數據元素對。可以分開地或獨立地對這些相應的源數據元素對中的每一個執行向量操作,以便生成匹配數量的結果數據元素,且因而每一對相應的源數據元素可以具有相應的結果數據元素。通常,這樣的指令的結果數據元素是以相同的次序,且它們常常具有相同的大小。
附圖說明
在各個附圖的圖形中,本發明的各實施例是作為示例而不是顯示說明的,在附圖中,類似的參考編號表示類似的元件。應注意,在本公開中對“一”或“一個”實施例的不同引用不一定指相同實施例,且這種引用表示至少一個。此外,當結合一個實施例描述特定特征、結構或特性時,認為在本領域技術人員學識范圍內,可以與其他實施例一起實施這樣的特征、結構或特性,無論是否對此明確描述。
圖1是具有含一個或多個乘法和累加(MAC)指令的指令集的處理器的示例實施例的框圖。
圖2示出乘法和累加操作的示例。
圖3示出由MAC指令和相關聯的加法指令所使用的向量寄存器和掩碼寄存器的示例實施例。
圖4A和4B示出MAC指令和相關聯的加法指令及其操作的示例實施例。
圖5示出包括MAC指令和相關聯的加法指令的樣本代碼的示例。
圖6是具有執行單元的指令處理裝置的示例實施例的框圖,該執行單元可操作用于執行包含MAC指令和相關聯的加法指令的示例實施例的指令。
圖7A和7B是示出用于處理MAC指令和相關聯的加法指令的方法的示例實施例的流程圖。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于英特爾公司,未經英特爾公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710330038.9/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:多線程架構
- 下一篇:用于提供軟件更新的系統和方法





