[發明專利]面向向量處理器的卷積神經網絡運算向量化方法有效
| 申請號: | 201810687639.X | 申請日: | 2018-06-28 |
| 公開(公告)號: | CN108985450B | 公開(公告)日: | 2019-10-29 |
| 發明(設計)人: | 劉仲;田希;陳海燕;郭陽;扈嘯;孫永節;陳躍躍;王麗萍 | 申請(專利權)人: | 中國人民解放軍國防科技大學 |
| 主分類號: | G06N3/063 | 分類號: | G06N3/063;G06F17/15;G06F17/16 |
| 代理公司: | 湖南兆弘專利事務所(普通合伙) 43008 | 代理人: | 周長清;胡君 |
| 地址: | 410073 湖南*** | 國省代碼: | 湖南;43 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 緩沖區 卷積運算 運算 卷積神經網絡 向量處理器 向量存儲器 輸入特征 向量數據 向量化 計算效率 結果傳輸 卷積計算 向量處理 向量陣列 循環執行 依次讀取 并行性 卷積核 累加 移動 處理器 存儲 | ||
本發明公開一種面向向量處理器的卷積神經網絡運算向量化方法,步驟包括:S1.將向量存儲器的L1D設置為SRAM方式,并劃分為兩個緩沖區;S2.依次將輸入特征數據傳入到兩個緩沖區中;S3.依次將卷積核數據傳入到向量存儲器的向量陣列中;S4.依次開啟兩個緩沖區的計算,每個緩沖區計算時依次選取一個移動卷積運算窗口進行卷積運算,每個移動卷積運算窗口進行運算時,依次讀取一個輸入特征數據并擴展為向量數據,各卷積核分別與擴展得到的向量數據進行乘累加;S5.由向量處理部件將卷積計算結果傳輸到片外存儲中;S6.循環執行步驟S2~S5。本發明具有實現方法簡單、處理器的并行性以及計算效率高等優點。
技術領域
本發明涉及基于卷積神經網絡的深度學習技術領域,尤其涉及一種面向向量處理器的卷積神經網絡運算向量化方法。
背景技術
目前基于卷積神經網絡(Convolutional Neural Networks,CNN)的深度學習模型在圖像識別和分類、機器翻譯、文本自動處理、語音識別、自動駕駛、視頻分析等各個方面均取得了令人矚目的成就,成為各領域的研究熱點。卷積神經網絡是一種深度前饋神經網絡,通常由若干個卷積層、激活層和池化層交替組成,其中卷積層通過卷積核與輸入特征做卷積運算進行特征提取,從而學習到各個分級的特征。卷積神經網絡計算中卷積層計算占據整個網絡結構90%的計算量,因而優化和加速卷積層計算成為提升卷積神經網絡計算性能的關鍵。
為了提高卷積神經網絡的性能,當前不斷的提出越來越深和復雜的網絡結構,典型的如LeNet,AlexNet,VGGNet,GoogleNet等,但是隨著網絡規模的不斷擴大,網絡參數的規模也越來越大,相應的大規模的卷積神經網絡計算對處理器的處理性能和數據存儲帶寬也越來越高。目前業界普遍是采用高性能GPU來滿足卷積神經網絡計算要求,甚至通過設計專用的卷積神經網絡處理器來加速卷積神經網絡計算,但是高性能GPU的計算性能有限,實現卷積神經網絡計算效率仍有待提高,尤其是無法滿足大規模卷積神經網絡的計算性能要求,而設計專用的卷積神經網絡處理器成本高,實現復雜。
向量處理器是一種新穎的體系結構,在保持較低功耗的同時,具有強大的計算能力,適合加速卷積神經網絡計算。向量處理器通常包括標量處理部件(Scalar ProcessingUnit,SPU)和向量處理部件(Vector Processing Unit,VPU),SPU負責標量任務計算和流控,VPU負責向量計算,提供主要的計算能力,包括若干向量處理單元(Vector ProcessingElement,VPE),每個VPE包含MAC、ALU、BP等多個運算功能部件,SPU和VPU之間提供數據傳輸和交換機制,實現標、向量數據的共享和通信,向量數據訪問單元支持向量數據的Load/Store,提供大容量的專用向量存儲器,而不是單核處理器的Cache機制。但是現有的卷積神經網絡計算方法并不能直接適用于上述向量處理器中,目前還尚未有有效的方案可以面向向量處理器實現高效的卷積神經網絡運算,因而亟需提供一種面向向量處理器的卷積神經網絡運算向量化方法,以發揮向量處理器的計算效率,加速卷積神經網絡的計算。
發明內容
本發明要解決的技術問題就在于:針對現有技術存在的技術問題,本發明提供一種實現方法簡單、卷積運算效率高,且向量處理器并行性以及計算效率高的面向向量處理器的卷積神經網絡運算向量化方法。
為解決上述技術問題,本發明提出的技術方案為:
一種面向向量處理器的卷積神經網絡運算向量化方法,步驟包括:
S1.將向量存儲器的標量存儲L1D設置為SRAM方式,并根據向量處理器的體系結構特征參數、輸入特征參數和卷積核參數將L1D劃分為兩個緩沖區以存儲輸入特征數據;
S2.依次將輸入特征數據傳入到L1D的兩個緩沖區中;
S3.依次將卷積核數據傳入到向量存儲器的向量陣列中進行存儲;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國人民解放軍國防科技大學,未經中國人民解放軍國防科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810687639.X/2.html,轉載請聲明來源鉆瓜專利網。





