[發明專利]使用用于向量歸一化的單個指令集架構(ISA)指令在審
| 申請號: | 202011000014.5 | 申請日: | 2020-09-22 |
| 公開(公告)號: | CN112907711A | 公開(公告)日: | 2021-06-04 |
| 發明(設計)人: | A·里舍克桑;S·帕爾;S·拉科什米納拉亞納;S·馬余蘭 | 申請(專利權)人: | 英特爾公司 |
| 主分類號: | G06T15/00 | 分類號: | G06T15/00;G06T15/06;G06T19/00;G06T1/20 |
| 代理公司: | 上海專利商標事務所有限公司 31100 | 代理人: | 陳依心;何焜 |
| 地址: | 美國加利*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 使用 用于 向量 歸一化 單個 指令 架構 isa | ||
1.一種方法,包括:
響應于由圖形處理單元GPU接收到指定用于對V個向量的集合中的每個向量執行的向量歸一化操作的單個指令:
對于每N個輸入集合,每個輸入集合表示所述V個向量的集合中的N個向量的多個分量向量并且存儲在V/N個寄存器的第一集合的相應寄存器中,由所述GPU的第一處理單元通過對N個輸入集合執行N個并行點積操作、每次生成N個平方長度值來生成V個平方長度值,每個平方長度值表示所述V個向量的集合中的一個向量的平方長度;以及
對于所述V個平方長度值中的每N個平方長度值,由所述GPU的第二處理單元通過對N個平方長度值執行N個并行操作、每次生成N個輸出集合來生成V個輸出集合,每個輸出集合表示所述V個向量的集合中的一個向量的多個歸一化分量向量,其中所述N個并行操作中的每一個實現平方根倒數函數和向量縮放函數的組合。
2.如權利要求1所述的方法,其中,由所述GPU的第二處理單元生成V個輸出集合將所述V個輸出集合存儲在V/N個寄存器的第二集合的相應寄存器中,其中每次存儲N個輸出集合。
3.如權利要求1或2所述的方法,其中,V是八,并且其中N是二。
4.如權利要求3所述的方法,其中,所述V/N個寄存器的第一集合包括四個256位寄存器,并且其中所述多個分量向量包括三個32位分量向量。
5.如權利要求4所述的方法,其中,所述V/N個寄存器的第二集合包括四個256位寄存器,并且其中所述多個歸一化分量向量包括三個32位歸一化分量向量。
6.如權利要求3所述的方法,其中,所述第一處理單元包括浮點單元FPU,并且其中所述第二處理單元包括協處理器。
7.如權利要求3所述的方法,其中,所述N個并行點積操作源自2寬度單指令多數據SIMD點積指令。
8.如權利要求3所述的方法,其中,所述N個并行操作源自2寬度單指令多數據SIMD指令。
9.如權利要求1或2所述的方法,其中,所述平方根倒數函數包括對操作數執行單精度平方根倒數操作,包括:
對所述操作數的指數分量執行平方根倒數操作;
對所述操作數的尾數分量執行平方根倒數操作,包括:
將所述尾數分量分為第一子分量和第二子分量;
確定對所述第一子分量的所述平方根倒數操作的結果;以及
確定對所述第二子分量的所述平方根倒數操作的結果;以及
返回所述平方根倒數操作的結果。
10.一種圖形處理單元GPU,包括:
V/N個寄存器的第一集合;
第一處理單元,耦合至所述V/N個寄存器的第一集合;
第二處理單元,耦合至所述V/N個寄存器的第一集合;
執行單元,能操作以響應于接收到指定用于對V個向量的集合中的每個向量執行的向量歸一化操作的單個指令,(i)發布用于由所述第一處理單元執行的V/N個N寬度單指令多數據SIMD點積操作;以及(ii)發布用于由所述第二處理單元執行的實現平方根倒數函數和向量縮放函數的組合的V/N個N寬度單指令多數據SIMD操作;
其中所述第一處理單元能操作以對于每N個輸入集合,每個輸入集合表示所述V個向量的集合中的N個向量的多個分量向量并且存儲在所述V/N個寄存器的第一集合的相應寄存器中,通過執行所述V/N個N寬度SIMD點積操作中的一個、每次生成N個平方長度值來生成V個平方長度值,每個平方長度值表示所述V個向量的集合中的一個向量的平方長度;以及
其中所述第二處理單元能操作以通過對所述V個平方長度值中的每N個平方長度值執行所述V/N個N寬度SIMD操作中的一個、每次生成N個輸出集合來生成V個輸出集合,每個輸出集合表示所述V個向量的集合中的一個向量的多個歸一化分量向量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于英特爾公司,未經英特爾公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011000014.5/1.html,轉載請聲明來源鉆瓜專利網。





