[發明專利]具有低功率并行矩陣乘法流水線的流處理器在審
| 申請號: | 201711249532.9 | 申請日: | 2017-12-01 |
| 公開(公告)號: | CN109871236A | 公開(公告)日: | 2019-06-11 |
| 發明(設計)人: | 陳佳升;鄒云曉;邁克爾·J·曼托爾;艾倫·拉什 | 申請(專利權)人: | 超威半導體公司 |
| 主分類號: | G06F9/38 | 分類號: | G06F9/38 |
| 代理公司: | 上海勝康律師事務所 31263 | 代理人: | 樊英如;張華 |
| 地址: | 美國加利*** | 國省代碼: | 美國;US |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 點積 矢量寄存器 流水線 并行矩陣 矩陣乘法 低功率 乘法 流處理器 接收結果 累加 操作數 耦合到 寫回 檢索 配置 | ||
1.一種系統,包括:
第一矢量寄存器堆;和
耦合到所述第一矢量寄存器堆的第一執行流水線,其中所述第一執行流水線包括多個點積單元,并且其中所述多個點積單元中的每一個點積單元被配置為:
計算第一組操作數中的元素與第二組操作數中的對應元素的多個乘積;和
計算累加輸入和所述多個乘積的總和,其中所述總和是所述點積單元的輸出。
2.如權利要求1所述的系統,其中所述系統被配置為從所述第一矢量寄存器堆讀取所述第一組操作數和所述第二組操作數,并將所述第一組操作數和所述第二組操作數提供給所述第一執行流水線。
3.如權利要求1所述的系統,其中所述系統還包括第二矢量寄存器堆,其中所述系統被配置為從所述第二矢量寄存器堆讀取多個累加輸入,并將所述多個累加輸入提供給所述第一執行流水線。
4.如權利要求3所述的系統,其中,每個點積單元還被配置為將所述輸出寫入到所述第二矢量寄存器堆,其中先前點積操作的輸出是被加到當前點積操作的總和的累加輸入。
5.如權利要求1所述的系統,其中所述系統還包括第二執行流水線,其中所述第二執行流水線被配置為與由所述第一執行流水線正在執行的點積操作并行地執行操作。
6.如權利要求5所述的系統,其中所述系統還被配置為:
在第一周期中從所述第一矢量寄存器堆讀取所述第一組操作數和所述第二組操作數并且將所述第一組操作數和所述第二組操作數存儲在存儲元件中;和
在第二周期中從所述第一矢量寄存器堆讀取第三組操作數并且將所述第三組操作數提供給所述第二執行流水線。
7.如權利要求1所述的系統,其中所述第一組操作數是第一矩陣的行,并且其中所述第二組操作數是第二矩陣的列,并且其中所述多個點積單元被配置成將所述第一矩陣乘以所述第二矩陣。
8.一種方法,其包括:
計算第一組操作數的元素和第二組操作數的對應元素的多個乘積;和
計算累加輸入和所述多個乘積的總和,其中所述總和是點積單位的輸出。
9.如權利要求8所述的方法,還包括從第一矢量寄存器堆讀取所述第一組操作數和所述第二組操作數,并將所述第一組操作數和所述第二組操作數提供給第一執行流水線。
10.如權利要求8所述的方法,還包括從第二矢量寄存器堆讀取多個累加輸入,并將所述多個累加輸入提供給第一執行流水線。
11.如權利要求10所述的方法,其還包括將所述輸出寫入所述第二矢量寄存器堆,其中先前點積操作的輸出是被加到當前點積操作的總和的累加輸入。
12.如權利要求8所述的方法,還包括與由第一執行流水線正在執行的點積操作并行地在第二執行流水線上執行操作。
13.如權利要求12所述的方法,還包括:
在第一周期中從第一矢量寄存器堆讀取所述第一組操作數和所述第二組操作數并且將所述第一組操作數和所述第二組操作數存儲在存儲元件中;和
在第二周期中從所述第一矢量寄存器堆讀取第三組操作數并且將所述第三組操作數提供給所述第二執行流水線。
14.如權利要求8所述的方法,其中所述第一組操作數是第一矩陣的行,并且其中所述第二組操作數是第二矩陣的列,并且其中所述方法進一步包括利用多個點積單元將所述第一矩陣乘以所述第二矩陣。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于超威半導體公司,未經超威半導體公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711249532.9/1.html,轉載請聲明來源鉆瓜專利網。





