日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]一種基于FPGA輕量級卷積加速器的設計方法在審

專利信息
申請號: 202110365541.4 申請日: 2021-04-06
公開(公告)號: CN113112002A 公開(公告)日: 2021-07-13
發明(設計)人: 臧陽陽;張菁;張天馳 申請(專利權)人: 濟南大學
主分類號: G06N3/04 分類號: G06N3/04;G06N3/08
代理公司: 暫無信息 代理人: 暫無信息
地址: 250022 *** 國省代碼: 山東;37
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 一種 基于 fpga 輕量級 卷積 加速器 設計 方法
【說明書】:

發明公開了一種基于FPGA卷積加速的方法。首先通用處理器用于解析神經網絡配置信息以及權值數據,并將神經網絡配置信息以及權值數據寫入RAM中,針對外存訪問帶寬限制,基于設計空間探索確定循環分塊因子以最大化數據重用,從而提高整個網絡的運算性能。然后FPGA從RAM中讀取配置信息,用于生成FPGA加速器,接著通用處理器讀入圖片信息,并把它寫入DRAM中,然后FPGA加速器從DRAM中讀取圖片數據并開始計算,并把計算結果寫入DRAM中。本發明加速器使得各層能夠同時部署在FPGA芯片上,并以流水線的方式運行,提高了運算性能和數據吞吐率。

技術領域

本發明涉及卷積加速領域,具體涉及基于FPGA輕量級卷積加速器的設計方法。

背景技術

隨著消費電子、汽車電子、工業控制等越來越多的應用引入人工智能(AI),人工智能面臨著前所未有的快速發展,深度學習、神經網絡等技術迎來了發展高潮。神經網絡越大,需要的計算量就越大,傳統的VPU雖然也能完成人工智能運算,但因為高功耗和高延遲已經略顯疲憊。在VPU上加載人工智能計算能力則可以規避這些問題,而且具有更高的可靠性。目標應用包括車載系統中的影像拍攝,以及基于行人、自行車等高精度物體識別的輔助駕駛以及自動泊車。另一個重要的應用便是顯示系統,例如電視、數字標牌,NNA可在超分辨率處理時增強圖像識別,提高4K/8K屏幕高清晰度成像。Socionext將不斷創新并開發出高效、高性能產品,以適應各種邊緣計算環境中廣泛的AI應用。人工智能專用加速器強調的是適當時間提供給合適的智能。對現有的制造業的提升,包括縮短開發周期、降低成本、提升效率等。采用虛擬制造技術可以在產品設計階段就模擬出該產品的整個生命周期,從而更有效,更經濟、更靈活的組織生產,實現了產品開發周期最短,產品成本最低,產品質量最優,生產效率最高的保證。發展出全新的制造模式,加快這些產業的發展,加速普及市場應用,就能夠形成一個個新的經濟增長點。

由于通用處理器CPU需要在各種應用場景下提供良好的性能,因此CPU內部大部分是控制邏輯,計算單元只占很小一部分,通用處理器的這種特性難以保證神經網絡推斷對實時性的要求。在卷積神經網絡的研究初期,研究人員使用中央處理器在計算機上對卷積神經網絡進行訓練和預測的工作。但隨著卷積神經網絡層數的不斷加深,網絡中的計算量和參數量都變得十分巨大,對于以串行處理結構的CPU來說,對于卷積神經網絡的處理速度有很大的局限性。而圖形處理器(GPU)內部包含幾千個流處理器,可以并行執行大量計算任務。利用GPU這一特性,使其成為了研究人員加速卷積神經網絡訓練階段的主要方式。但是GPU的缺點也十分明顯,雖然有著較高的性能,但是功耗也十分巨大。尤其在PC端使用GPU對卷積神經網絡進行訓練時,功耗可高達數百瓦特。由于GPU自身存在體積大、功耗高的缺點,限制它在體積小,功耗低的移動端和嵌入式平臺上的推廣與應用。

這項發明卷積加速器研究,基于現有的神經網絡,本發明公開了一種基于FPGA的深度神經網絡平臺,包括通用處理器和FPGA和RAM,第一個通用處理器用來解決神經網絡的權重配置信息和數據,以及神經網絡的權重配置信息和數據內存,訪問帶寬限制CRT,基于設計周期確定的空間探索塊因子是為了最大限度地重用數據,然后FPGA從RAM讀取配置信息,利用FPGA加速卡生成加速卡,然后通用處理器讀取圖像信息,然后FPGA加速卡從DRAM中讀取圖像數據并開始計算,并將計算結果寫入DRAM中。最后,通用處理器從DRAM中讀取分類結果。本發明的加速器可以使各層同時部署在FPGA芯片上,并以流水線的方式運行,使沒有硬件知識的程序員可以利用現有的FPGA資源輕松獲得良好的性能。

發明內容

本發明的目的在于提供輕量型卷積神經網絡加速的方法。本發明具體實現如下所示:

(1)模型初始化,使用通用處理器解析神經網絡配置信息以及權重數據并寫到緩存RAM中模型初始化后進行歸一化操作,所有權值在0~1的范圍內服從正太分布。

(2)在(1)中針對外部存儲訪問限制的問題,基于空間探索確定循環分塊的方式進行訪問優化。使用原始權值矩陣的部分參數構造分塊矩陣去代替原始矩陣。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于濟南大學,未經濟南大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202110365541.4/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 日本少妇高潮xxxxⅹ| 91av一区二区三区| 日韩精品一区在线视频| 午夜爽爽视频| 国产福利精品一区| 狠狠色狠狠色合久久伊人| 国产精品96久久久久久又黄又硬| 国产综合久久精品| 99国产精品久久久久| 91午夜在线| 午夜剧场一区| 亚洲少妇一区二区| 老太脱裤子让老头玩xxxxx| **毛片在线免费观看| 丰满岳乱妇在线观看中字| 岛国黄色网址| 综合久久激情| 玖玖国产精品视频| 欧美精品一区二区久久| 日韩欧美国产高清91| 99久久国产综合精品女不卡| 国产精品久久久久久久久久久久冷| 波多野结衣女教师电影| 国产男女乱淫真高清视频免费| 国产一区二区二| 久草精品一区| 91精品国产综合久久婷婷香| 久久一区二区精品视频| 欧美日韩国产免费观看| 日韩精品一区二区免费| 久久精品国产99| 欧美一区二区色| 99久久国产免费| 91精品福利在线| 日韩中文字幕在线一区二区| 一区二区三区欧美精品| 6080日韩午夜伦伦午夜伦| 狠狠色噜噜狼狼狼色综合久| 久久午夜无玛鲁丝片午夜精品| 欧美国产精品久久| 波多野结衣女教师电影| 91精品啪在线观看国产| 亚洲乱亚洲乱妇50p| 国产黄色网址大全| 久久综合伊人77777麻豆| 国产一区二区三区黄| 理论片高清免费理伦片| 国产91高清| 欧美一区二区性放荡片| 中文字幕一区二区三区又粗| 好吊妞国产欧美日韩软件大全| 午夜片在线| 亚洲国产美女精品久久久久∴| 久久国产视屏| 一本大道久久a久久精品| 国产午夜一级片| 欧美在线播放一区| 亚洲精品国产精品国产| 国产精品视频1区| 国产精品1区二区| 麻豆视频免费播放| 国产欧美日韩在线观看| 狠狠躁狠狠躁视频专区| 国产精品久久久久久久久久久久久久久久 | 国产88av| 欧美在线精品一区| 中文字幕在线一区二区三区| 在线国产一区二区| 青苹果av| 亚洲神马久久| 99久久夜色精品国产网站| 精品国产一级| 91精品国产高清一区二区三区| 亚洲国产99| 高清人人天天夜夜曰狠狠狠狠| 99国精视频一区一区一三| 日本一二三不卡| 亚洲精品国产一区| 中文字幕二区在线观看| 岛国黄色av| 亚洲一级中文字幕| 午夜影院91|