[發(fā)明專利]使用矩陣乘法加速器(MMA)實(shí)施基本計算原語在審
| 申請?zhí)枺?/td> | 201880014494.5 | 申請日: | 2018-03-01 |
| 公開(公告)號: | CN110352422A | 公開(公告)日: | 2019-10-18 |
| 發(fā)明(設(shè)計)人: | A·J·雷德芬;T·D·安德森;K·車爾卡;C·羅;Z·余 | 申請(專利權(quán))人: | 德克薩斯儀器股份有限公司 |
| 主分類號: | G06F17/16 | 分類號: | G06F17/16 |
| 代理公司: | 北京紀(jì)凱知識產(chǎn)權(quán)代理有限公司 11245 | 代理人: | 袁策 |
| 地址: | 美國德*** | 國省代碼: | 美國;US |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 原語 矩陣乘法 流式傳輸 加速器 格式化數(shù)據(jù) 存儲器 設(shè)備執(zhí)行 處理器 配置 引擎 | ||
在一種用于在設(shè)備中執(zhí)行基本計算原語的方法中,該設(shè)備包括處理器和矩陣乘法加速器(MMA)。該方法包括配置(200)設(shè)備中的流式傳輸引擎以從存儲器流式傳輸用于基本計算原語的數(shù)據(jù),配置(202)MMA以格式化數(shù)據(jù),以及由設(shè)備執(zhí)行(204)基本計算原語。
背景技術(shù)
諸如語音識別、智能工業(yè)控制、對象檢測和識別以及視覺等應(yīng)用越來越多地遷移到嵌入式設(shè)備。在此類設(shè)備中可能需要硬件加速以支持在此類應(yīng)用中使用的算法的計算需求。
發(fā)明內(nèi)容
本文描述的示例涉及使用矩陣乘法加速器來實(shí)施基本計算原語。在一個方面,提供一種用于在設(shè)備中執(zhí)行基本計算原語的方法,其中該設(shè)備包括處理器和矩陣乘法加速器(MMA)。該方法包括配置設(shè)備中的流式傳輸引擎以從存儲器流式傳輸用于基本計算原語的數(shù)據(jù),配置MMA以格式化數(shù)據(jù),以及由設(shè)備執(zhí)行基本計算原語。
在一個方面,提供一種設(shè)備,該設(shè)備包括存儲器、耦合到存儲器的處理器以及耦合到處理器的矩陣乘法加速器(MMA),該MMA包括乘數(shù)緩沖器和第一被乘數(shù)緩沖器,其中該設(shè)備可操作以配置設(shè)備中的流式傳輸引擎以從存儲器流式傳輸用于基本計算原語的數(shù)據(jù),配置MMA以格式化數(shù)據(jù)并執(zhí)行基本計算原語。
附圖說明
圖1描繪可配置成使用耦合到處理器的矩陣乘法加速器(MMA)來實(shí)施基本計算原語的示例設(shè)備。
圖2為用于在圖1的設(shè)備中執(zhí)行基本計算原語的方法的流程圖。
圖3為示出圖1的設(shè)備中的批量小矩陣矩陣乘法的實(shí)施方式的示例。
圖4為示出圖1的設(shè)備中的大矩陣矩陣乘法的實(shí)施方式的示例。
圖5為示出圖1的設(shè)備中的矩陣矩陣逐點(diǎn)乘法的實(shí)施方式的示例。
圖6為示出圖1的設(shè)備中的矩陣矩陣加法的實(shí)施方式的示例。
圖7為示出圖1的設(shè)備中的小向量矩陣乘法的實(shí)施方式的示例。
圖8為示出圖1的設(shè)備中的小向量求和的實(shí)施方式的示例。
圖9為示出圖1的設(shè)備中的仿射變換的實(shí)施方式的示例。
圖10和圖11為示出圖1的設(shè)備中的二維(2D)卷積的實(shí)施方式的示例。
圖12為示出圖1的設(shè)備中的矩陣行置換的實(shí)施方式的示例。
圖13為示出圖1的設(shè)備中的向量列置換的實(shí)施方式的示例。
圖14為示出濾波器大小和吞吐量之間的折衷的曲線圖。
具體實(shí)施方式
為了一致性,附圖中的相同元件由相同的附圖標(biāo)記表示。
本文描述的示例提供使用矩陣乘法加速器(MMA)實(shí)施諸如語音識別、智能工業(yè)控制、對象檢測和識別以及視覺的應(yīng)用所使用的基本計算原語。基本計算原語包括例如在卷積神經(jīng)網(wǎng)絡(luò)(CNN)中使用的二維(2D)卷積、小矩陣矩陣乘法和大矩陣矩陣乘法、矩陣矩陣逐點(diǎn)乘法、矩陣矩陣加法、向量矩陣乘法、向量求和、仿射變換、快速傅里葉變換、離散余弦變換、卷積、相關(guān)、矩陣賦值、矩陣置換和矩陣變換。
圖1描繪示例設(shè)備100,該示例設(shè)備100可配置成使用耦合到處理器102的矩陣乘法加速器(MMA)104來實(shí)施基本計算原語,諸如本文先前提到的那些。MMA104包括執(zhí)行矩陣乘法的功能。矩陣乘法為從兩個矩陣產(chǎn)生矩陣的二進(jìn)制操作。更具體地,如果乘數(shù)矩陣A為M×K矩陣并且被乘數(shù)矩陣B為K×N矩陣,則這兩個矩陣的矩陣乘積為M×N矩陣C,其中A的行n上的m個元素與B的列K下的m個元素相乘,并求和以產(chǎn)生元素Cmn。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于德克薩斯儀器股份有限公司,未經(jīng)德克薩斯儀器股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201880014494.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 應(yīng)用程序的運(yùn)行方法、模擬器、宿主機(jī)及系統(tǒng)
- 一種進(jìn)行測試的方法和設(shè)備
- 一種指令信息處理方法及裝置
- 一種漢語縮略語自動發(fā)現(xiàn)的方法及裝置
- 一種端到端網(wǎng)絡(luò)服務(wù)時延的確定方法及裝置
- 分布式系統(tǒng)節(jié)點(diǎn)身份認(rèn)證方法及裝置
- FPGA芯片描述文件的生成方法、裝置、存儲介質(zhì)及電子設(shè)備
- 提供用于網(wǎng)絡(luò)設(shè)備的可編程包分類框架的系統(tǒng)和方法
- 一種實(shí)現(xiàn)瀏覽器兼容的方法及裝置
- 測試用例的生成方法、裝置、存儲介質(zhì)和電子設(shè)備
- 降低在流式會話期間傳輸信道差錯所造成的影響
- 適應(yīng)數(shù)字流式傳輸源和格式的快速變化的裝置和方法
- 用于流式傳輸視頻的自適應(yīng)降噪引擎
- 管理媒體流的并發(fā)流式傳輸
- 用于處理流式傳輸視頻圖像以校正經(jīng)調(diào)幅光的閃變的系統(tǒng)和方法
- 用于處理視頻數(shù)據(jù)以通過動態(tài)曝光控制來檢測和消除閃變光源的系統(tǒng)和方法
- 車載網(wǎng)絡(luò)流式數(shù)據(jù)優(yōu)化方法及裝置
- 數(shù)據(jù)處理方法和數(shù)據(jù)處理裝置
- 一種數(shù)據(jù)的檢查點(diǎn)設(shè)置方法及裝置
- 一種流式分析儀的樣本制備裝置及制備方法





