日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]一種在FPGA上實現的CUDA內核的方法在審

專利信息
申請號: 201611194611.X 申請日: 2016-12-22
公開(公告)號: CN106777710A 公開(公告)日: 2017-05-31
發明(設計)人: 李延凱;龔俊;陳剛;唐建 申請(專利權)人: 中國兵器裝備集團自動化研究所
主分類號: G06F17/50 分類號: G06F17/50
代理公司: 中國工程物理研究院專利中心51210 代理人: 翟長明,韓志英
地址: 621000 四*** 國省代碼: 四川;51
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 一種 fpga 實現 cuda 內核 方法
【說明書】:

技術領域

發明涉及一種在FPGA上實現的CUDA內核的方法,使用FPGA進行科學運算和圖像處理領域,特別是涉及一種在FPGA上實現的CUDA內核并行算法的方法。

背景技術

目前,FPGA和GPGPU已經成為科學運算和圖像處理的一個重要組成部分,兩者均能夠提供高度的并行運算性能。在設計和開發流程上,FPGA開發和GPGPU開發有著本質的區別,FPGA開發使用HDL語言VHDL或者Verilog;GPGPU使用Nvidia公司的CUDA語言,且這兩種語言無法交替使用。

使用Nvidia公司的CUDA編程模型,可實現高度并行任務的處理,尤其在科學運算和圖像分析領域,CUDA編程模型提供了一套通用的科學運算和圖像處理的應用程序接口(API)供用戶直接調用,使得程序員在應用中輕易完成細粒度和粗粒度并行算法。

HDL語言則是另一種不同與CUDA的計算機語言,HDL語言要求用戶對底層數字電路有很強的理論基礎和專業知識,編寫算法需要熟練的編程基礎和數字信號處理基礎,開發周期和難度遠遠大于CUDA編程模型。

最后,GPGPU能效比較低,GPGPU一般少則上百瓦,多則數百瓦,可以達到數TGFlops的浮點能力,而FPAG只需要十幾瓦,即可達到與GPGPU相當的浮點能力。在對與功率要求小,且處理能力強的應用場合,如無人系統和便攜式工作站,FPGA的優勢則會得到很大的體現。

為此,在使用者層面,希望能用簡單的方法實現復雜的功能,這里提及一種在FPGA上實現的CUDA內核的方法,從而達到在FPGA上運行具有高度并行運算能力的CUDA內核。

發明內容

本發明的目的為解決背景技術所描述的問題,提供[一種在FPGA上實現的CUDA內核的方法]。

其硬件平臺連接為:將安裝有Vivado設計開發環境的計算機,通過FPGA仿真器,與FPGA硬件平臺相連;本發明選用的FPGA仿真器為Xilinx DLC9G USB 仿真器,其具備Xilinx全系FPGA在線仿真及執行文件下載功能。將該仿真器一端接計算機USB端口,另一端接FPGA JTAG端口。FPGA硬件開發平臺選用Xilinx VC707開發平臺,FPGA型號為Virtex-7 XC7VX485T。

在上述硬件開發平臺之上,開發步驟如下:

(1)在安裝有CUDA編程模型的計算機中,找到所需要的并行算法,并提取CUDA開發環境中C/C++并行算法工程文件.cpp以及支持庫文件.h。(2)將算法工程文件以及庫文件導入至Vivado HDL設計開發環境中(3)根據實際需求,修改和調試算法函數。(4)將調試好的函數以及算法工程文件進行編譯和綜合,生成RTL文件。(5)將RTL文件導入至頂層Verilog/VHDL設計,進行邏輯綜合、生成FPGA可執行文件.bin。(6)通過下載線將可執行文件下載至FPGA運行,完成從CUDA C/C++并行算法到FPGA的移植工作。

其中,對于更具實際需求,修改和調試算法函數包括以下步驟:

(1)根據實際需求,修改CUDA算法接口函數,使其與應用相匹配。(2)將修改后的算法通過仿真命令,在Vivado HDL中進行仿真運行,檢查輸入值與輸出值是否與應用相匹配。(3)將調試后的算法,進行編譯和綜合。

附圖說明

為了更清楚地說明本發明實施例,下面將對實施例中所需要使用的附圖做簡單的介紹,顯而易見地,下面描述中的附圖僅僅是本發明的一些實施例,對于本領域普通技術人員來講,在不付出創造性勞動的前提下,還可以根據這些附圖獲得其他的附圖。

圖1為本發明提供的一種在FPGA上實現的CUDA內核的方法的流程圖;

圖中100.CUDAC/C++并行算法代碼,圖中200.FCUDA編譯器,圖中300.Vivado HLS 工具,圖中400.生成RTL描述語言,圖中500.與頂層語言相結合進行綜合,生成FPGA可執行文件。

圖2為本發明中硬件連接框圖;

圖中將仿真器2一端接計算機1 USB端口,另一端接FPGA JTAG 4端口。FPGA硬件開發平臺3選用Xilinx VC707開發平臺,FPGA型號為Virtex-7 XC7VX485T。

具體實施方式

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國兵器裝備集團自動化研究所,未經中國兵器裝備集團自動化研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201611194611.X/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 国产真实乱偷精品视频免| 国产精品乱码一区二区三区四川人 | 日韩中文字幕在线一区二区| 亚洲第一区国产精品| 欧美一区二区三区免费看| 国产一区午夜| 狠狠色噜噜狠狠狠狠综合久| 国产一区日韩在线| 一本色道久久综合亚洲精品浪潮| 国产精品日韩在线观看| 日韩av在线网| 亚洲乱亚洲乱妇28p| 岛国黄色av| 乱子伦农村| 免费视频拗女稀缺一区二区| 久久久久久久久亚洲精品| 午夜影院你懂的| 综合久久一区| 国产免费一区二区三区网站免费 | 91午夜精品一区二区三区| 国产欧美视频一区二区三区| 久久久精品99久久精品36亚 | 国产一级片网站| 国产精品国外精品| 精品久久二区| 丰满少妇高潮惨叫久久久一| 91精品久| 国产视频二区在线观看| 久久99精品国产麻豆婷婷洗澡 | 窝窝午夜精品一区二区| 日韩精品免费一区| 亚洲国产视频一区二区三区| 国产一区在线免费| 午夜一区二区视频| 午夜看片网站| 野花国产精品入口| 日本一二三区视频| 午夜剧场一区| 国产一级在线免费观看| 国产在线一二区| 午夜大片男女免费观看爽爽爽尤物| 鲁丝一区二区三区免费观看| 久久精品色欧美aⅴ一区二区| 日韩av三区| 欧美久久精品一级c片| 狠狠色综合欧美激情| 扒丝袜网www午夜一区二区三区| 精品国产九九| 国产真实一区二区三区| 日韩精品免费播放| 欧美激情精品久久久久久免费 | 国产va亚洲va在线va| 国产一区2| 国产午夜精品一区二区三区四区| 日韩中文字幕在线一区| 日日夜夜一区二区| 精品国产乱码一区二区三区在线 | 久久人人爽爽| 91看黄网站| 久久综合狠狠狠色97| 一区二区三区日韩精品| 高清国产一区二区| 夜夜躁日日躁狠狠躁| 欧美一区久久| 一区二区三区四区国产| 久久精品视频偷拍| 中文字幕一区二区三区不卡 | 欧美日韩三区二区| 高清国产一区二区 | 国产日韩一区二区三区| 国产欧美日韩va另类在线播放| 国产精品视频久久久久久久| 免费的午夜毛片| 午夜av片| 日韩欧美高清一区二区| 丝袜美腿诱惑一区二区| 一色桃子av大全在线播放| 午夜国产一区| 国产精品美女一区二区视频| 精品久久不卡| 在线精品国产一区二区三区88| 精品久久久久久久免费看女人毛片|