[發(fā)明專(zhuān)利]可重新配置的矩陣乘法器系統(tǒng)和方法有效
| 申請(qǐng)?zhí)枺?/td> | 201880014540.1 | 申請(qǐng)日: | 2018-02-28 |
| 公開(kāi)(公告)號(hào): | CN110383237B | 公開(kāi)(公告)日: | 2023-05-26 |
| 發(fā)明(設(shè)計(jì))人: | A·J·雷德芬;D·E·史泰斯;T·D·安德森;K·車(chē)爾卡 | 申請(qǐng)(專(zhuān)利權(quán))人: | 德克薩斯儀器股份有限公司 |
| 主分類(lèi)號(hào): | G06F7/52 | 分類(lèi)號(hào): | G06F7/52;G06F17/16 |
| 代理公司: | 北京紀(jì)凱知識(shí)產(chǎn)權(quán)代理有限公司 11245 | 代理人: | 李英 |
| 地址: | 美國(guó)德*** | 國(guó)省代碼: | 暫無(wú)信息 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 重新 配置 矩陣 乘法器 系統(tǒng) 方法 | ||
可重新配置的矩陣乘法器(RMM)(0410)系統(tǒng)/方法允許緊密或松散耦合到片上系統(tǒng)(SOC)環(huán)境(0401)中的監(jiān)督控制處理器應(yīng)用控制邏輯(ACL)。RMM(0410)提供C=A*B矩陣乘法運(yùn)算,其具有A乘數(shù)矩陣(AMM)、B被乘數(shù)矩陣(BMM)和C乘積矩陣(CPM),以及C=A*B+D運(yùn)算,其中D求和矩陣(DSM)表示先前乘法運(yùn)算的結(jié)果或另一個(gè)先前定義的矩陣。RMM(0410)提供附加的CPM?LOAD/STORE(加載/存儲(chǔ))路徑,允許計(jì)算/數(shù)據(jù)傳輸操作(0421,0422,0423)的重疊,并從先前計(jì)算的CPM結(jié)果向AMM或BMM操作數(shù)輸入提供CPM數(shù)據(jù)反饋。RMM(0410)預(yù)期共同使用8、16和32位操作數(shù)的可重新配置矩陣數(shù)據(jù)以及512位數(shù)據(jù)寬度的外部存儲(chǔ)器總線和使用一系列RMM配置字(RCW)和流操作碼功能(SOF)實(shí)施的指令控制單元(ICU)。
技術(shù)領(lǐng)域
本發(fā)明涉及實(shí)現(xiàn)形式C=A*B和C=A*B+D的矩陣乘法的硬件,其中A乘數(shù)矩陣(AMM)、B被乘數(shù)矩陣(BMM)、C乘積矩陣(CPM)和D-求和矩陣(DSM)的數(shù)據(jù)寬度可以動(dòng)態(tài)地重新配置以解譯包含在固定外部存儲(chǔ)器數(shù)據(jù)總線(EMB)內(nèi)的數(shù)據(jù)。
背景技術(shù)
這涉及可重新配置的矩陣乘法器(RMM)系統(tǒng)和實(shí)現(xiàn)固定點(diǎn)矩陣乘法的方法。RMM提供C=A*B矩陣乘法運(yùn)算,具有A乘數(shù)矩陣(AMM)、B被乘數(shù)矩陣(BMM)和C乘積矩陣(CPM),以及C=A*B+D運(yùn)算,其中D求和矩陣(DSM)表示先前乘法運(yùn)算的結(jié)果或另一個(gè)先前定義的矩陣。多位輸入數(shù)據(jù)(A,B,D)可以被解譯為以可重新配置的方式在固定的外部存儲(chǔ)器數(shù)據(jù)總線內(nèi)復(fù)制,從而允許矩陣乘法器硬件重用,與從最低精度的基線開(kāi)始的矩陣縮放匹配并且對(duì)于精度每增加一倍:
·每個(gè)維度中的C矩陣尺寸減少一半;
·矩陣乘法器-累加器(MAC)縮放四分之一,實(shí)現(xiàn)高效的矩陣乘法器重用;
·C矩陣?yán)奂悠骶缺3譃檩斎霐?shù)據(jù)(A,B,D)精度的四倍,與輸入數(shù)據(jù)類(lèi)型無(wú)關(guān)(在一些實(shí)施例中,C矩陣?yán)奂悠骶缺3衷谳斎霐?shù)據(jù)(A,B,D)精度的雙多邊形倍數(shù));
之前使用的B矩陣和C矩陣行的一半可以被釋放并且可以用于替代算法。
C累加器矩陣可以包括附加的加載存儲(chǔ)(LOAD-STORE)數(shù)據(jù)路徑,其:
·改善長(zhǎng)卷積和C=A*B+D運(yùn)算的性能;
·在8位輸入數(shù)據(jù)的情況下,包括使用附加的C矩陣存儲(chǔ)器;
·在16位和32位輸入數(shù)據(jù)的情況下,可以包括可以實(shí)現(xiàn)的額外C矩陣存儲(chǔ)器,或者可以實(shí)現(xiàn)現(xiàn)有的兩個(gè)C矩陣存儲(chǔ)器的額外行。
發(fā)明內(nèi)容
可重新配置的矩陣乘法器(RMM)系統(tǒng)/方法允許在片上系統(tǒng)(SOC)環(huán)境中與監(jiān)督控制處理器應(yīng)用控制邏輯(ACL)緊密或松散耦合。RMM提供C=A*B矩陣乘法運(yùn)算,其具有A乘數(shù)矩陣(AMM)、B被乘數(shù)矩陣(BMM)和C乘積矩陣(CPM),以及C=A*B+D運(yùn)算,其中D求和矩陣(DSM)表示先前乘法運(yùn)算的結(jié)果或另一個(gè)先前定義的矩陣。RMM提供附加的CPM?LOAD/STORE(加載/存儲(chǔ))路徑,允許計(jì)算/數(shù)據(jù)傳輸操作的重疊,并從先前計(jì)算的CPM結(jié)果向AMM或BMM操作數(shù)輸入提供CPM數(shù)據(jù)反饋。RMM預(yù)期使用8、16和32位操作數(shù)的可重新配置的矩陣數(shù)據(jù)以及512位數(shù)據(jù)寬度的外部存儲(chǔ)器總線和使用一系列RMM配置字(RCW)和流操作碼功能(SOF)實(shí)現(xiàn)的指令控制單元(ICU)。
附圖說(shuō)明
圖1示出實(shí)施例的系統(tǒng)塊圖。
圖2示出在緊密耦合的可重新配置的矩陣乘法器(RMM)應(yīng)用背景中實(shí)現(xiàn)的實(shí)施例的系統(tǒng)塊圖。
圖3示出在松散耦合的可重新配置的矩陣乘法器(RMM)應(yīng)用背景中實(shí)現(xiàn)的實(shí)施例的系統(tǒng)塊圖。
圖4示出使用512位外部存儲(chǔ)器總線(EMB)與CPU接口連接的實(shí)施例的系統(tǒng)塊圖。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于德克薩斯儀器股份有限公司,未經(jīng)德克薩斯儀器股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201880014540.1/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F7-00 通過(guò)待處理的數(shù)據(jù)的指令或內(nèi)容進(jìn)行運(yùn)算的數(shù)據(jù)處理的方法或裝置
G06F7-02 .比較數(shù)字值的
G06F7-06 .將單個(gè)記錄載體上的數(shù)據(jù)進(jìn)行排序、選擇、合并或比較的裝置
G06F7-22 .用于排序或合并在連續(xù)記錄載體
G06F7-38 .只利用數(shù)制表示,例如利用二進(jìn)制、三進(jìn)制、十進(jìn)制表示來(lái)完成計(jì)算的方法或裝置
G06F7-58 .隨機(jī)數(shù)或偽隨機(jī)數(shù)發(fā)生器
- 在集成電路器件中求解線性矩陣
- 矩陣計(jì)算裝置、矩陣計(jì)算方法
- 一種數(shù)據(jù)聚類(lèi)的方法、裝置及Spark大數(shù)據(jù)平臺(tái)
- 適用于黑白圖片的神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)方法以及訓(xùn)練方法
- 適用于灰度圖片的神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)方法以及訓(xùn)練方法
- 矩陣
- 矩陣/密鑰生成裝置、矩陣/密鑰生成系統(tǒng)、矩陣結(jié)合裝置、矩陣/密鑰生成方法、程序
- 矩陣運(yùn)算電路、矩陣運(yùn)算裝置及矩陣運(yùn)算方法
- 矩陣乘法計(jì)算方法和裝置
- 數(shù)據(jù)讀取方法、裝置、介質(zhì)和計(jì)算設(shè)備





