[發(fā)明專利]基于OpenCL的卷積神經(jīng)網(wǎng)絡(luò)并行處理方法有效
| 申請(qǐng)?zhí)枺?/td> | 201910331464.3 | 申請(qǐng)日: | 2019-04-24 |
| 公開(公告)號(hào): | CN110110844B | 公開(公告)日: | 2021-01-12 |
| 發(fā)明(設(shè)計(jì))人: | 田小林;荀亮;張晰;李嬌嬌;李芳;李帥;逯甜甜;焦李成 | 申請(qǐng)(專利權(quán))人: | 西安電子科技大學(xué) |
| 主分類號(hào): | G06N3/04 | 分類號(hào): | G06N3/04 |
| 代理公司: | 陜西電子工業(yè)專利中心 61205 | 代理人: | 田文英;王品華 |
| 地址: | 710071 陜*** | 國省代碼: | 陜西;61 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 opencl 卷積 神經(jīng)網(wǎng)絡(luò) 并行 處理 方法 | ||
1.一種基于OpenCL的卷積神經(jīng)網(wǎng)絡(luò)并行處理方法,其特征在于,獲取圖像數(shù)據(jù)矩陣的重組矩陣,分塊并行計(jì)算權(quán)值矩陣與重組矩陣的乘積,并行批量歸一化乘積矩陣;該方法的具體步驟包括如下:
(1)獲取圖像數(shù)據(jù)矩陣的重組矩陣:
(1a)在主機(jī)內(nèi)存中讀取圖像數(shù)據(jù)矩陣;
(1b)在GPU全局內(nèi)存中創(chuàng)建圖像數(shù)據(jù)矩陣緩存對(duì)象,將圖像數(shù)據(jù)矩陣從主機(jī)內(nèi)存?zhèn)鬏斨翀D像數(shù)據(jù)矩陣緩存對(duì)象中;
(1c)對(duì)圖像數(shù)據(jù)矩陣進(jìn)行并行組合重排,獲得一個(gè)二維的重組矩陣;
(2)獲取權(quán)值矩陣:
(2a)在主機(jī)內(nèi)存中分別讀取卷積核的數(shù)量和所有卷積核的權(quán)值,將所讀取的所有卷積核的權(quán)值依次按行排列,組成權(quán)值矩陣;
(2b)在GPU全局內(nèi)存中創(chuàng)建權(quán)值矩陣緩存對(duì)象,將權(quán)值矩陣從主機(jī)內(nèi)存?zhèn)鬏斨翙?quán)值矩陣緩存對(duì)象中;
(3)分塊并行計(jì)算權(quán)值矩陣與重組矩陣的乘積:
(3a)創(chuàng)建OpenCL矩陣乘法內(nèi)核,設(shè)置OpenCL矩陣乘法內(nèi)核的二維全局工作項(xiàng)總數(shù)和二維工作組大小,并行執(zhí)行OpenCL矩陣乘法內(nèi)核的所有工作項(xiàng);
(3b)以64×64個(gè)數(shù)據(jù)元素的大小,將權(quán)值矩陣不重疊地均勻分塊,每一塊構(gòu)成一個(gè)權(quán)值共享矩陣,將重組矩陣不重疊地均勻分塊,每一塊構(gòu)成一個(gè)重組共享矩陣,在GPU中并行地將所有權(quán)值共享矩陣和重組共享矩陣從全局內(nèi)存?zhèn)鬏斨凉ぷ鹘M的局部?jī)?nèi)存;
(3c)以8×4個(gè)數(shù)據(jù)元素的大小,將權(quán)值共享矩陣不重疊地均勻分塊,每一塊構(gòu)成一個(gè)權(quán)值因子矩陣,將重組共享矩陣不重疊地均勻分塊,每一塊構(gòu)成一個(gè)重組因子矩陣,在GPU中并行地將所有權(quán)值因子矩陣和重組因子矩陣從局部?jī)?nèi)存?zhèn)鬏斨凉ぷ黜?xiàng)的私有內(nèi)存;
(3d)在每個(gè)并行的工作項(xiàng)中,將權(quán)值因子矩陣和重組因子矩陣相乘,將乘積累加后組成乘積分塊矩陣;
(3e)在GPU全局內(nèi)存中創(chuàng)建乘積矩陣緩存對(duì)象,將每個(gè)工作項(xiàng)中的乘積分塊矩陣組合成完整的乘積矩陣,并行地將乘積矩陣從私有內(nèi)存中傳輸至乘積矩陣緩存對(duì)象中;
(4)對(duì)乘積矩陣進(jìn)行并行批量歸一化:
(4a)創(chuàng)建OpenCL批量均方內(nèi)核,將OpenCL批量均方內(nèi)核的一維全局工作項(xiàng)數(shù)設(shè)置為乘積矩陣行數(shù)的512倍,將一維工作組大小設(shè)置為512,并行執(zhí)行OpenCL批量均方內(nèi)核的所有工作項(xiàng);
(4b)在GPU中并行地計(jì)算批量乘積矩陣中每行的均值和每行的方差;
(4c)創(chuàng)建OpenCL批量歸一化內(nèi)核,將OpenCL批量歸一化內(nèi)核的一維全局工作項(xiàng)總數(shù)設(shè)置為批量乘積矩陣的總數(shù)與乘積矩陣行數(shù)和列數(shù)的乘積,將一維工作組大小設(shè)置為512,并行執(zhí)行OpenCL批量歸一化內(nèi)核的所有工作項(xiàng);
(4d)在GPU中并行地將乘積矩陣進(jìn)行批量歸一化;
(5)輸出特征值矩陣:
(5a)使用帶泄漏的線性整流函數(shù),構(gòu)造OpenCL激活內(nèi)核,計(jì)算批量乘積矩陣的總數(shù)與乘積矩陣行數(shù)和列數(shù)的乘積,將該乘積設(shè)置為OpenCL激活內(nèi)核的一維全局工作項(xiàng)的總數(shù),將一維工作組大小設(shè)置為512;
(5b)利用帶泄漏的線性整流函數(shù),在GPU中將乘積矩陣中的每個(gè)元素并行地進(jìn)行激活,得到特征值矩陣;
(5c)將GPU全局內(nèi)存中的特征值矩陣傳輸回主機(jī)內(nèi)存,輸出特征值矩陣和運(yùn)行時(shí)間。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于西安電子科技大學(xué),未經(jīng)西安電子科技大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910331464.3/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 一種畫質(zhì)調(diào)節(jié)方法及系統(tǒng)
- 一種向量點(diǎn)積的OpenCL自動(dòng)化實(shí)現(xiàn)方法
- 一種提高OpenCL硬件執(zhí)行效率的方法
- 基于OpenCL移動(dòng)設(shè)備QC-LDPC的動(dòng)態(tài)譯碼方法
- 基于Andorid平臺(tái)的OpenCL圖像處理方法
- 程序的加載方法、裝置、系統(tǒng)以及電子設(shè)備
- 基于FPGA的Tensorflow系統(tǒng)加速的設(shè)計(jì)方法
- 一種基于OpenCL的雙目立體匹配方法
- 一種OpenCL內(nèi)核提交的方法及裝置
- 面向軟件超結(jié)點(diǎn)的OpenCL編程框架構(gòu)建方法和裝置
- 卷積運(yùn)算處理方法及相關(guān)產(chǎn)品
- 一種卷積神經(jīng)網(wǎng)絡(luò)的計(jì)算方法及系統(tǒng)
- 卷積運(yùn)算方法及系統(tǒng)
- 卷積運(yùn)算方法、裝置及系統(tǒng)
- 深度神經(jīng)網(wǎng)絡(luò)裁剪方法、裝置及電子設(shè)備
- 基于卷積神經(jīng)網(wǎng)絡(luò)的圖像處理方法和圖像處理裝置
- 卷積神經(jīng)網(wǎng)絡(luò)及基于卷積神經(jīng)網(wǎng)絡(luò)的圖像處理方法
- 一種圖像處理方法、裝置以及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 用于卷積神經(jīng)網(wǎng)絡(luò)的卷積運(yùn)算裝置
- 基于FPGA實(shí)現(xiàn)圖像識(shí)別的方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 硬件神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法、計(jì)算裝置、軟硬件協(xié)作系統(tǒng)
- 生成較大神經(jīng)網(wǎng)絡(luò)
- 神經(jīng)網(wǎng)絡(luò)的生成方法、生成裝置和電子設(shè)備
- 一種舌診方法、裝置、計(jì)算設(shè)備及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
- 脈沖神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法及相關(guān)轉(zhuǎn)換芯片
- 圖像處理方法、裝置、可讀存儲(chǔ)介質(zhì)和計(jì)算機(jī)設(shè)備
- 一種適應(yīng)目標(biāo)數(shù)據(jù)集的網(wǎng)絡(luò)模型微調(diào)方法、系統(tǒng)、終端和存儲(chǔ)介質(zhì)
- 用于重構(gòu)人工神經(jīng)網(wǎng)絡(luò)的處理器及其操作方法、電氣設(shè)備
- 一種圖像神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的優(yōu)化方法及裝置





