[發明專利]一種卷積神經網絡加速器及其工作方法有效
| 申請號: | 202110656789.6 | 申請日: | 2021-06-11 |
| 公開(公告)號: | CN113312285B | 公開(公告)日: | 2023-08-18 |
| 發明(設計)人: | 王碩;楊靚;金玉琳;閆鑫;楊晨東;秦晴;紀虎東;朱青;程智 | 申請(專利權)人: | 西安微電子技術研究所 |
| 主分類號: | G06F13/28 | 分類號: | G06F13/28;G06N3/0464;G06N3/08;G06N3/063 |
| 代理公司: | 西安通大專利代理有限責任公司 61200 | 代理人: | 崔方方 |
| 地址: | 710065 陜西*** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 卷積 神經網絡 加速器 及其 工作 方法 | ||
本發明公開了一種卷積神經網絡加速器及其工作方法,屬于數字電路領域。本發明中的寄存器管理單元用于存儲對卷積陣列的配置文件,當前卷積計算的各項參數信息,同時記錄卷積陣列當前的運算狀態,供主處理器查詢;全局緩存模塊用于對filter、ifmap和psum進行緩存;卷積陣列控制模塊在接收到啟動命令后根據寄存器管理單元提供的參數信息進行相應的數據交互操作,進行filter/ifmap和psum的傳遞;卷積陣列由大量PE單元級聯而成,用于實現卷積運算;Pooling層用于進行池化計算;激活函數用于進行激活函數的計算。本發明克服了CNN卷積器的最大化輸入數據重用和最小化Psum產生是無法同時實現的缺點。
技術領域
本發明屬于數字電路領域,尤其是一種卷積神經網絡加速器及其工作方法。
背景技術
近些年來,隨著人工智能技術的飛速發展,深度學習正成為機器學習領域中越來越重要的組成部分。卷積神經網絡(CNN)是深度學習領域最為重要的工具之一,它對圖像的平移、比例縮放、傾斜等形式的變形具有高度的適應性。它的權值共享網絡結構使之更類似于生物神經網絡結構,降低了網絡模型的復雜度,減少了權值的數量。該優點在網絡的輸入是多維圖像時表現的更為明顯,使圖像可直接作為網絡的輸入,避免了傳統識別算法中復雜的特征提取和數據重建過程。因此,近年來卷積神經網絡結構在視頻監控、機器視覺、模式識別等領域得到越來越廣泛的應用。
目前常見的CNN網絡模型中的卷積層層數從數層到數百層不等。權重(Filter),輸入圖像(ifmap),輸出圖像(ofmap)均為多維結構。每一個卷積層都有多個通道(channel)的filter,每一個channel的filter和ifmaps都是由多個二維(2D)平面組成的三維(3D)結構,在一層卷積層中,每一批(batch)輸入的3D-ifmaps都會與多個channel的3D-filter進行計算,得到卷積計算結果(ofmaps)。完成卷積計算后,卷積層輸出結果之前還需加上偏置(bias),進行激活(Activation)和量化(Quantization)。一層卷積計算的計算公式可由以下公式表示:
0≤z<N,0≤u<M,0≤x<F,0≤y<E,
E=(H-R+U)/U,F=(W-S+U)/U.
其中,N是3D-ifmaps的批次數(batch),M是輸出圖像(ofmap)的通道數,C是輸入圖像(ifmap)的通道數,H/W是Ifmap平面的高度/寬度,R/S是Filter平面的高度/寬度(全連接層中R/S=H),E/F是Ofmap平面的高度/寬度(全連接層中E/F=1),U是卷積計算的步長。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西安微電子技術研究所,未經西安微電子技術研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110656789.6/2.html,轉載請聲明來源鉆瓜專利網。





