[發明專利]針對卷積神經網絡硬件加速器的調試模塊有效
| 申請號: | 201810009449.2 | 申請日: | 2018-01-05 |
| 公開(公告)號: | CN108197699B | 公開(公告)日: | 2020-04-07 |
| 發明(設計)人: | 黃松璞;姜晶菲;竇勇;許金偉 | 申請(專利權)人: | 中國人民解放軍國防科技大學 |
| 主分類號: | G06N3/04 | 分類號: | G06N3/04;G06N3/063 |
| 代理公司: | 長沙中科啟明知識產權代理事務所(普通合伙) 43226 | 代理人: | 任合明 |
| 地址: | 410003 湖*** | 國省代碼: | 湖南;43 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 針對 卷積 神經網絡 硬件 加速器 調試 模塊 | ||
本發明公開了一種針對卷積神經網絡硬件加速器的調試模塊,目的是增大定位準確性和降低調試難度。本發明由DRAM即動態隨機存取存儲器、FIFO即先進先出隊列、讀DRAM計數模塊、寫DRAM計數模塊和數據對齊模塊組成;寫DRAM計數模塊和讀DRAM計數模塊均是二進制計數器,DRAM是擁有寫端口和讀端口的雙端口DRAM;數據對齊模塊對讀DRAM數據進行拼接和補零操作,得到寫FIFO數據;FIFO是讀寫異步FIFO。DRAM的數據位寬和深度根據所需觀測數據信號的位寬和數量設置,FIFO的數據位寬根據DDR的數據位寬設置,數據深度根據寫FIFO數據的數量設置。本發明能夠更加準確方便地定位問題位置,既增大定位準確性又降低調試難度。
技術領域
本發明涉及計算機領域的硬件加速器調試模塊,尤其指一種針對卷積神經網絡的硬件加速器調試模塊。
背景技術
卷積神經網絡CNN(Convolutional Neural Networks)受神經科學研究的啟發,經過長達20多年的演變,CNN在計算機視覺、人工智能領域越來越突出。CNN已經廣泛用于圖像識別,因為它能模仿生物視覺神經的行為獲得很高識別準確率。一個典型CNN由兩部分組成:特征提取器和分類器。特征提取器過濾輸入圖像,產生表示圖像不同特征(這些特征可能包括拐角,線,圓弧等,對位置和形變不敏感)的低維向量。向量送入分類器(通常基于傳統的人工神經網絡),得到向量對應的輸入圖像屬于某個類別(不同的分類任務有不同的類型集合,如人臉識別任務中,每個人都代表一個類別)的可能性。
CNN作為一種前饋網絡結構,網絡層之間具有高度的獨立性:各層網絡計算獨立,層間無數據反饋。因此,CNN是一種高度并行的網絡結構。但通用處理器的為執行邏輯處理和事務處理而優化的特性并不適合用來挖掘CNN的并行性,基于軟件方式的CNN神經網絡在實時性和功耗方面都不能滿足應用的需求。為了充分挖掘卷積神經網絡固有的并行性,越來越多的研究者開始采用現場可編程門陣列FPGA(Field Programmable Gate Array)開發基于CNN神經網絡的應用。FPGA作為一種可編程器件,具有計算資源豐富、靈活可配、開發周期短、高性能等優點。
目前廣泛采用的FPGA設計的CNN加速器(即卷積神經網絡硬件加速器)的結構如圖1所示,整個加速器主要由四個部分組成,PCIE(Peripheral Component InterconnectExpress,高速串行計算機擴展總線標準)接口、DDR(Double Data Rate,雙倍速率同步動態隨機存儲器)模塊、傳輸控制模塊和CNN模塊。
PCIE接口與上位機(用于給CNN加速器發送指令和數據并進行觀測的計算機)、DDR模塊、傳輸控制模塊相連。PCIE接口接收來自上位機的原始數據(圖像數據與CNN網絡權值數據),通過DMA(Direct Memory Access,直接內存存取)方式將原始數據寫入DDR模塊中。PCIE接口接收來自上位機的啟動信號,將啟動信號發送給傳輸控制模塊。在計算結束后,PCIE接口接收來自傳輸控制模塊的結束信號,并通過DMA方式從DDR模塊中讀取計算結果,再將結束信號和計算結果傳輸給上位機。
DDR模塊與PCIE接口、傳輸控制模塊相連。DDR模塊接收來自PCIE接口的原始數據,將原始數據分批傳輸給傳輸控制模塊。DDR模塊接收來自傳輸控制模塊的計算結果,將計算結果傳輸給PCIE接口。
傳輸控制模塊與PCIE接口、DDR模塊、CNN模塊相連。傳輸控制模塊接收來自DDR模塊的原始數據,將原始數據傳輸給CNN模塊;傳輸控制模塊接收來自PCIE模塊的啟動信號,啟動CNN模塊的計算;在CNN模塊計算完成之后,傳輸控制模塊接收來自CNN模塊的計算結果,將計算結果傳輸給DDR模塊,并將結束信號傳輸給PCIE接口。另外,傳輸控制模塊有一個用于調試的調試接口。
CNN模塊與傳輸控制模塊相連。CNN模塊接收來自傳輸控制模塊的原始數據,使用原始數據進行計算,并將計算結果傳回傳輸控制模塊。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國人民解放軍國防科技大學,未經中國人民解放軍國防科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810009449.2/2.html,轉載請聲明來源鉆瓜專利網。





