[發(fā)明專(zhuān)利]使用矩陣乘法加速器(MMA)實(shí)施基本計(jì)算原語(yǔ)在審
| 申請(qǐng)?zhí)枺?/td> | 201880014494.5 | 申請(qǐng)日: | 2018-03-01 |
| 公開(kāi)(公告)號(hào): | CN110352422A | 公開(kāi)(公告)日: | 2019-10-18 |
| 發(fā)明(設(shè)計(jì))人: | A·J·雷德芬;T·D·安德森;K·車(chē)爾卡;C·羅;Z·余 | 申請(qǐng)(專(zhuān)利權(quán))人: | 德克薩斯儀器股份有限公司 |
| 主分類(lèi)號(hào): | G06F17/16 | 分類(lèi)號(hào): | G06F17/16 |
| 代理公司: | 北京紀(jì)凱知識(shí)產(chǎn)權(quán)代理有限公司 11245 | 代理人: | 袁策 |
| 地址: | 美國(guó)德*** | 國(guó)省代碼: | 美國(guó);US |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 原語(yǔ) 矩陣乘法 流式傳輸 加速器 格式化數(shù)據(jù) 存儲(chǔ)器 設(shè)備執(zhí)行 處理器 配置 引擎 | ||
1.一種用于在設(shè)備中執(zhí)行基本計(jì)算原語(yǔ)的方法,所述設(shè)備包括處理器和矩陣乘法加速器即MMA,所述方法包括:
配置被包括在所述設(shè)備中的流式傳輸引擎以從存儲(chǔ)器流式傳輸用于所述基本計(jì)算原語(yǔ)的數(shù)據(jù);
配置所述MMA以格式化所述數(shù)據(jù);以及
由所述設(shè)備執(zhí)行所述基本計(jì)算原語(yǔ)。
2.根據(jù)權(quán)利要求1所述的方法,其中執(zhí)行所述基本計(jì)算原語(yǔ)還包括在使用第二被乘數(shù)矩陣緩沖器中的數(shù)據(jù)執(zhí)行矩陣乘法的同時(shí)將數(shù)據(jù)加載到第一被乘數(shù)矩陣緩沖器中,所述第一被乘數(shù)矩陣緩沖器和所述第二被乘數(shù)矩陣緩沖器被包括在所述MMA中。
3.根據(jù)權(quán)利要求1所述的方法,其中配置所述MMA還包括配置所述MMA以偏移被包括在所述MMA中的被乘數(shù)矩陣緩沖器中的加載數(shù)據(jù)。
4.根據(jù)權(quán)利要求1所述的方法,其中所述數(shù)據(jù)包括矩陣的行,并且其中執(zhí)行所述基本計(jì)算原語(yǔ)還包括將所述數(shù)據(jù)復(fù)制到被包括在所述MMA中的被乘數(shù)矩陣緩沖器中的列。
5.根據(jù)權(quán)利要求1所述的方法,還包括配置所述處理器以將零填充添加到所述MMA的輸出。
6.根據(jù)權(quán)利要求1所述的方法,還包括配置所述處理器以對(duì)所述MMA的輸出執(zhí)行接縫去除。
7.根據(jù)權(quán)利要求1所述的方法,還包括配置所述處理器以根據(jù)指定步幅對(duì)所述MMA的輸出執(zhí)行列子采樣。
8.根據(jù)權(quán)利要求1所述的方法,其中配置所述流式傳輸引擎還包括配置所述流式傳輸引擎以將多個(gè)特征映射的數(shù)據(jù)瓦片式拼接為濾波矩陣。
9.根據(jù)權(quán)利要求8所述的方法,其中選擇數(shù)據(jù)瓦片的大小,使得在所述MMA的所述輸出中不存在接縫。
10.根據(jù)權(quán)利要求8所述的方法,其中選擇數(shù)據(jù)瓦片的大小,使得接縫始終在所述MMA的所述輸出中的相同位置。
11.根據(jù)權(quán)利要求1所述的方法,其中所述數(shù)據(jù)包括復(fù)數(shù),其中所述復(fù)數(shù)的實(shí)部和虛部被交錯(cuò)存儲(chǔ)在所述存儲(chǔ)器中,并且所述方法還包括配置所述處理器以將每個(gè)復(fù)數(shù)分成所述實(shí)部和所述虛部,以用于加載到所述MMA中。
12.根據(jù)權(quán)利要求1所述的方法,其中所述基本計(jì)算原語(yǔ)為快速傅里葉變換即FFT,并且執(zhí)行所述基本計(jì)算原語(yǔ)還包括:
將離散傅里葉變換矩陣即DFT矩陣加載到被包括在所述MMA中的乘數(shù)矩陣緩沖器中,并將數(shù)據(jù)矩陣加載到被包括在所述MMA中的被乘數(shù)矩陣緩沖器中,以對(duì)所述數(shù)據(jù)矩陣的列執(zhí)行所述FFT;以及
將所述數(shù)據(jù)矩陣加載到所述乘數(shù)矩陣緩沖器中并且將所述DFT矩陣加載到被乘數(shù)矩陣緩沖器中,以對(duì)所述數(shù)據(jù)矩陣的行執(zhí)行所述FFT。
13.根據(jù)權(quán)利要求1所述的方法,其中所述數(shù)據(jù)包括長(zhǎng)度大于被包括在所述MMA中的被乘數(shù)矩陣緩沖器的寬度的濾波器,并且所述濾波器被分解成多個(gè)較小濾波器,其中所述較小濾波器的大小被挑選為在最大化所述MMA的所述吞吐量和最小化較小濾波器的總數(shù)之間的折衷。
14.一種設(shè)備,其包括:存儲(chǔ)器;
處理器,其耦合到所述存儲(chǔ)器;以及
矩陣乘法加速器即MMA,其耦合到所述處理器,所述MMA包括乘數(shù)緩沖器和第一被乘數(shù)緩沖器,
其中所述設(shè)備可操作以:配置被包括在所述設(shè)備中的流式傳輸引擎,以從所述存儲(chǔ)器流式傳輸用于基本計(jì)算原語(yǔ)的數(shù)據(jù);配置所述MMA以格式化所述數(shù)據(jù);以及執(zhí)行所述基本計(jì)算原語(yǔ)。
15.根據(jù)權(quán)利要求14所述的設(shè)備,其中所述設(shè)備還可操作以執(zhí)行所述基本計(jì)算原語(yǔ),其中在使用被包括在所述MMA中的第二被乘數(shù)矩陣緩沖器中的數(shù)據(jù)執(zhí)行矩陣乘法的同時(shí)將數(shù)據(jù)加載到所述第一被乘數(shù)矩陣緩沖器中。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于德克薩斯儀器股份有限公司,未經(jīng)德克薩斯儀器股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201880014494.5/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語(yǔ)言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫(kù)結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 應(yīng)用程序的運(yùn)行方法、模擬器、宿主機(jī)及系統(tǒng)
- 一種進(jìn)行測(cè)試的方法和設(shè)備
- 一種指令信息處理方法及裝置
- 一種漢語(yǔ)縮略語(yǔ)自動(dòng)發(fā)現(xiàn)的方法及裝置
- 一種端到端網(wǎng)絡(luò)服務(wù)時(shí)延的確定方法及裝置
- 分布式系統(tǒng)節(jié)點(diǎn)身份認(rèn)證方法及裝置
- FPGA芯片描述文件的生成方法、裝置、存儲(chǔ)介質(zhì)及電子設(shè)備
- 提供用于網(wǎng)絡(luò)設(shè)備的可編程包分類(lèi)框架的系統(tǒng)和方法
- 一種實(shí)現(xiàn)瀏覽器兼容的方法及裝置
- 測(cè)試用例的生成方法、裝置、存儲(chǔ)介質(zhì)和電子設(shè)備
- 無(wú)線通信抗干擾系統(tǒng)及方法
- 神經(jīng)網(wǎng)絡(luò)卷積運(yùn)算裝置及方法
- 一種矩陣乘法的計(jì)算方法及裝置
- 基于提前收斂重復(fù)平方的限定域矩陣乘法距離積計(jì)算方法
- 矩陣乘法計(jì)算方法和裝置
- 用于矩陣運(yùn)算的乘法器陣列和用于卷積運(yùn)算的乘法器陣列
- 通過(guò)選擇加法器樹(shù)中間結(jié)果支持不同的矩陣乘法
- 一種用于矩陣乘法密集型算法的可重構(gòu)矩陣乘法加速系統(tǒng)
- 用于加速矩陣運(yùn)算的應(yīng)用程序編程接口
- 數(shù)據(jù)讀取方法、裝置、介質(zhì)和計(jì)算設(shè)備
- 降低在流式會(huì)話期間傳輸信道差錯(cuò)所造成的影響
- 適應(yīng)數(shù)字流式傳輸源和格式的快速變化的裝置和方法
- 用于流式傳輸視頻的自適應(yīng)降噪引擎
- 管理媒體流的并發(fā)流式傳輸
- 用于處理流式傳輸視頻圖像以校正經(jīng)調(diào)幅光的閃變的系統(tǒng)和方法
- 用于處理視頻數(shù)據(jù)以通過(guò)動(dòng)態(tài)曝光控制來(lái)檢測(cè)和消除閃變光源的系統(tǒng)和方法
- 車(chē)載網(wǎng)絡(luò)流式數(shù)據(jù)優(yōu)化方法及裝置
- 數(shù)據(jù)處理方法和數(shù)據(jù)處理裝置
- 一種數(shù)據(jù)的檢查點(diǎn)設(shè)置方法及裝置
- 一種流式分析儀的樣本制備裝置及制備方法





