[發明專利]基于OpenCL的卷積神經網絡并行處理方法有效
| 申請號: | 201910331464.3 | 申請日: | 2019-04-24 |
| 公開(公告)號: | CN110110844B | 公開(公告)日: | 2021-01-12 |
| 發明(設計)人: | 田小林;荀亮;張晰;李嬌嬌;李芳;李帥;逯甜甜;焦李成 | 申請(專利權)人: | 西安電子科技大學 |
| 主分類號: | G06N3/04 | 分類號: | G06N3/04 |
| 代理公司: | 陜西電子工業專利中心 61205 | 代理人: | 田文英;王品華 |
| 地址: | 710071 陜*** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 opencl 卷積 神經網絡 并行 處理 方法 | ||
本發明提出了一種基于OpenCL的卷積神經網絡并行處理方法,主要解決現有卷積神經網絡并行化處理中模型復雜度高、運行速度緩慢的問題。實現步驟為:獲取圖像數據矩陣的重組矩陣;獲取權值矩陣;分塊并行計算權值矩陣與重組矩陣的乘積;對乘積矩陣進行并行批量歸一化;輸出特征值矩陣。本發明利用計算機圖形處理器GPU中大量的并行計算單元,將卷積神經網絡的卷積過程轉化為大型矩陣乘法,分塊并行計算權值矩陣與重組矩陣的乘積,簡化了卷積層數據的處理過程,優化了數據的訪存方式,提高了數據的復用率,使得本發明大幅提高了卷積神經網絡的運行速度。
技術領域
本發明屬于計算機技術領域,更進一步涉及計算機視覺和深度學習技術領域中的一種使用開放計算語言OpenCL(Open Computing Language)的卷積神經網絡并行處理方法。本發明可以實現對卷積神經網絡的圖像卷積過程進行加速,可用于計算機視覺的實時目標檢測。
背景技術
卷積神經網絡的卷積過程需要進行大量的浮點運算,當卷積神經網絡的層數不斷加深時,CPU的執行效率遠遠不能滿足要求。而GPU提供了大量的并行計算單元,OpenCL可以在主機端對GPU進行編程,利用CPU+GPU的異構架構可以實現對卷積神經網絡的圖像卷積過程進行加速。
長沙馬沙電子科技有限公司在其申請的專利文獻“一種基于大規模高性能集群的卷積神經網絡并行處理方法”(申請日:2014年11月21日,申請號:2014106748603,公開號:CN104463324 A)中公開了一種基于大規模高性能集群的卷積神經網絡并行處理方法。該方法首先將要訓練的網絡模型構建出多個副本,每個副本的模型參數均相同,副本的個數與高性能集群的節點數相同,每個節點上分布一個模型副本;選定一個節點作為主節點,負責模型參數的廣播與收集。其次,將訓練集分為若干子集,每次將訓練子集分發給除主節點之外的其余子節點,共同進行參數梯度的計算,并將梯度值累計,累計值用來更新主節點模型參數,將更新后的模型參數廣播給各個子節點,直到模型訓練終止。該方法存在不足的是,通過構建網絡模型副本的方法實現卷積神經網絡的并行處理,并行化程度依賴于集群的節點數,模型復雜度高,可移植性差,成本較高,大大限制了其應用范圍。
西安電子科技大學在其申請的專利文獻“基于OpenCL標準的卷積神經網絡加速方法”(申請日:2017年7月5日,申請號:201710543986.0,公開號:CN107341127 A)中公開了一種基于OpenCL標準的卷積神經網絡加速方法。該方法首先將原始的三維圖像數據以及權重數據到GPU全局內存中,再將圖像數據傳輸到GPU的局部內存中,初始化參數、構造激活函數后計算卷積神經網絡的圖像數據,最后將計算結果傳回主機內存。該方法的不足之處是,該方法是將數據加載至GPU局部內存后進行卷積運算,數據的復用率較低,在訪存數據過程中需要耗費大量時間,導致卷積層運行速度慢。
發明內容
本發明的目的是針對上述現有技術的不足,提出一種基于OpenCL的卷積神經網絡并行處理方法,用于解決現有卷積神經網絡并行化處理中模型復雜度高、運行速度緩慢的問題。
實現本發明目的的思路是,根據圖像卷積原理,在GPU中將圖像數據矩陣轉化為一個二維的重組矩陣,將所有卷積核的權值組成一個二維的權值矩陣,將圖像的卷積過程轉化為權值矩陣與重組矩陣相乘的過程,再利用矩陣分塊乘法的原理將矩陣分塊并加載至OpenCL工作項的私有內存中進行相乘,對分塊矩陣的乘積進行累加得到重組矩陣和權值矩陣的乘積矩陣。然后,在GPU中對乘積矩陣進行并行批量歸一化。最后,使用帶泄漏的線性整流函數將乘積矩陣中每個元素進行激活,得到圖像的特征值矩陣。
本發明的具體步驟如下:
(1)獲取圖像數據矩陣的重組矩陣:
(1a)在主機內存中讀取圖像數據矩陣;
(1b)在GPU全局內存中創建圖像數據矩陣緩存對象,將圖像數據矩陣從主機內存傳輸至圖像數據矩陣緩存對象中;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西安電子科技大學,未經西安電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910331464.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:用于處理圖像的方法和系統
- 下一篇:一種基于并行多級寬度神經網絡的學習方法





