[發(fā)明專利]向量運算裝置有效
| 申請?zhí)枺?/td> | 202011132750.6 | 申請日: | 2020-10-21 |
| 公開(公告)號: | CN112199119B | 公開(公告)日: | 2022-02-01 |
| 發(fā)明(設(shè)計)人: | 不公告發(fā)明人 | 申請(專利權(quán))人: | 上海壁仞智能科技有限公司 |
| 主分類號: | G06F9/30 | 分類號: | G06F9/30;G06F17/16 |
| 代理公司: | 北京市金杜律師事務(wù)所 11256 | 代理人: | 董莘 |
| 地址: | 201114 上海市閔行區(qū)*** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 向量 運算 裝置 | ||
1.一種向量運算裝置,用于統(tǒng)合矩陣連乘和累加的計算,其特征在于,包括:
流多處理器,包含通用寄存器;以及
通用矩陣連乘計算單元,包含指令隊列和第一算術(shù)邏輯單元,其中,所述第一算術(shù)邏輯單元耦接所述通用寄存器,依據(jù)所述指令隊列中的通用矩陣連乘指令執(zhí)行矩陣連乘和累加計算,并且將計算結(jié)果存儲到所述通用寄存器;
所述流多處理器包含第二算術(shù)邏輯單元,所述第二算術(shù)邏輯單元耦接所述指令隊列,用于當(dāng)提取的指令是所述通用矩陣連乘指令時,從所述通用寄存器獲取來源數(shù)據(jù),將所述通用矩陣連乘指令和所述來源數(shù)據(jù)推入所述指令隊列。
2.如權(quán)利要求1所述的向量運算裝置,其特征在于,所述第二算術(shù)邏輯單元包含:
通用矩陣連乘操作碼對照表,存儲所述通用矩陣連乘指令的第一操作碼;
解復(fù)用器,包含輸入端、第一輸出端和第二輸出端,所述輸入端耦接操作碼寄存器和來源寄存器,所述操作碼寄存器存儲第二操作碼,所述來源寄存器存儲指向所述通用寄存器中的一第一地址,所述第一輸出端耦接流水線,所述第二輸出端耦接所述指令隊列;
讀取電路,耦接所述通用寄存器和所述指令隊列;以及
比較器,耦接所述通用矩陣連乘操作碼對照表和所述解復(fù)用器,用于判斷所述第一操作碼是否相符于所述第二操作碼;當(dāng)所述第一操作碼相符于所述第二操作碼時,輸出第一控制信號給所述解復(fù)用器,用于將所述第二操作碼輸出到所述指令隊列,以及輸出第二控制信號給所述讀取電路,用于驅(qū)動所述讀取電路從所述通用寄存器中的所述第一地址讀取所述來源數(shù)據(jù),并且將所述來源數(shù)據(jù)輸出到所述指令隊列。
3.如權(quán)利要求2所述的向量運算裝置,其特征在于,所述輸入端耦接目的地寄存器,所述目的地寄存器存儲指向所述通用寄存器中的一第二地址;所述比較器當(dāng)所述第一操作碼相符于所述第二操作碼時,輸出所述第一控制信號給所述解復(fù)用器,用于將所述第二地址輸出到所述指令隊列;所述第一算術(shù)邏輯單元將所述計算結(jié)果存儲至所述通用寄存器中的所述第二地址。
4.如權(quán)利要求2和3中任一項所述的向量運算裝置,其特征在于,所述第一地址和第二地址為代表通用寄存器文件的通用寄存器標(biāo)識符。
5.如權(quán)利要求2所述的向量運算裝置,其特征在于,所述輸入端耦接目的地寄存器,所述目的地寄存器存儲第二地址;所述第二算術(shù)邏輯單元包含所述流水線;所述比較器當(dāng)所述第一操作碼不相符于所述第二操作碼時,輸出所述第一控制信號給所述解復(fù)用器,用于輸出所述第二操作碼、所述第一地址和所述第二地址給所述流水線。
6.如權(quán)利要求5所述的向量運算裝置,其特征在于,所述第一操作碼關(guān)聯(lián)于跨區(qū)存儲指令,所述流水線在執(zhí)行所述跨區(qū)存儲指令時讀取所述通用寄存器的通用寄存器文件中的來源數(shù)據(jù),并且存儲所述來源數(shù)據(jù)至所述通用矩陣連乘計算單元中的本地緩存。
7.如權(quán)利要求5所述的向量運算裝置,其特征在于,所述第一操作碼關(guān)聯(lián)于跨區(qū)加載指令,所述流水線在執(zhí)行所述跨區(qū)加載指令時讀取所述通用矩陣連乘計算單元中的本地緩存的來源數(shù)據(jù),并且存儲所述來源數(shù)據(jù)至所述通用寄存器中的通用寄存器文件。
8.如權(quán)利要求1所述的向量運算裝置,其特征在于,所述第二算術(shù)邏輯單元當(dāng)提取的指令不是所述通用矩陣連乘指令時,使用所述第二算術(shù)邏輯單元中的流水線執(zhí)行所述提取的指令。
9.如權(quán)利要求1所述的向量運算裝置,其特征在于,所述通用矩陣連乘計算單元在每個時鐘周期執(zhí)行16K的矩陣連乘和累加的計算,并且耦接到16個所述流多處理器。
10.如權(quán)利要求1所述的向量運算裝置,其特征在于,所述流多處理器和所述通用矩陣連乘計算單元并行執(zhí)行不同的計算。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海壁仞智能科技有限公司,未經(jīng)上海壁仞智能科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011132750.6/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





