[發明專利]一種大規模矩陣卷積的多核實現方法有效
| 申請號: | 201711475199.3 | 申請日: | 2017-12-29 |
| 公開(公告)號: | CN107885700B | 公開(公告)日: | 2021-05-14 |
| 發明(設計)人: | 郭陽;張軍陽;楊超;田希;扈嘯;李斌;全擁 | 申請(專利權)人: | 中國人民解放軍國防科技大學 |
| 主分類號: | G06F17/15 | 分類號: | G06F17/15 |
| 代理公司: | 湖南兆弘專利事務所(普通合伙) 43008 | 代理人: | 周長清 |
| 地址: | 410073 湖南*** | 國省代碼: | 湖南;43 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 大規模 矩陣 卷積 多核 實現 方法 | ||
一種大規模矩陣卷積的多核實現方法,其步驟為:S1:根據多核處理器的核數M,單核VPE的數量為P,輸入特征圖的尺寸W×H×C,卷積核的尺寸k×k,通道數為C,卷積核的數量N,水平或垂直移動步長s,確定輸入特征圖的多核劃分方法;S2:將輸入特征圖按行進行劃分,將卷積核k×k×C×N按N方向進行劃分,單核分到的卷積核數量為P;S3:將按行劃分后的輸入特征圖分給若干計算核,將劃分后的卷積核分給相應的核;S4:所有核同時進行同樣的操作,直至完成整個輸入特征圖的卷積操作。本發明具有實現簡單、操作方便、可提高大規模矩陣卷積并行性、可以充分利用多核處理器加速等優點。
技術領域
本發明主要涉及到卷積神經網絡、人工智能領域,特指一種大規模矩陣卷積的多核實現方法。
背景技術
卷積是信號處理、圖像處理領域的一種常用計算,一般包括一維的線性卷積和二維的矩陣卷積,是一種典型的計算密集型和訪存密集型計算,二維矩陣卷積是當前卷積神經網絡模型中最常用的計算,也是耗時、耗資源最多的一種計算,一般要占據一個卷積神經網絡模型計算量的85%以上。因此,研究矩陣卷積的加速方法一直是當前的一個研究熱點。
大規模矩陣卷積,一般是指輸入特征圖比較大,而卷積核往往比較小,由于卷積核需要在輸入特征圖上滑動進行點積和累加運算,計算之間往往存在相關性,因此,難以并行起來,尤其是多核的并行更是比較困難。
多核處理器是加速大規模矩陣計算的一種重要方式,若能采取合理的矩陣劃分方式往往能夠大大加速矩陣卷積的計算過程,一般來說N個處理核理論上可以獲得N倍的加速比,因此,一方面需要有計算速度更快的處理器,另一方面也需要有合適的多核矩陣劃分方法,只有算法和硬件的合理配合才能發揮最大的計算效率。
發明內容
本發明要解決的技術問題就在于:針對現有技術存在的技術問題,本發明提供一種實現簡單、操作方便、可提高大規模矩陣卷積并行性、可以充分利用多核處理器加速的大規模矩陣卷積的多核實現方法。
為解決上述技術問題,本發明采用以下技術方案:
一種大規模矩陣卷積的多核實現方法,其步驟為:
S1:根據多核處理器的核數M,單核VPE的數量為P,輸入特征圖的尺寸W×H×C,卷積核的尺寸k×k,通道數為C,卷積核的數量N,水平或垂直移動步長s,確定輸入特征圖的多核劃分方法;
S2:將輸入特征圖按行進行劃分,將卷積核k×k×C×N按N方向進行劃分,單核分到的卷積核數量為P;
S3:將按行劃分后的輸入特征圖分給若干計算核,將劃分后的卷積核分給相應的核;
S4:所有核同時進行同樣的操作,直至完成整個輸入特征圖的卷積操作。
作為本發明的進一步改進:所述步驟S1中的輸入特征圖,W表示長,H表示寬,C表示通道。
作為本發明的進一步改進:所述輸入特征圖中彩色圖像用3通道表示,黑白圖用1通道表示。
作為本發明的進一步改進:所述輸入特征圖中k表示卷積核的尺寸,為方陣。
作為本發明的進一步改進:所述輸入特征圖中s表示卷積核在輸入特征圖上面的水平或垂直滑動步長,且一般水平滑動步長和垂直滑動步長相同。
作為本發明的進一步改進:所述步驟S1中,輸入特征圖的通道數和卷積核的通道數相同,且一般取N為P的整數倍。
作為本發明的進一步改進:所述步驟S3中計算任務的劃分原則是所有核的計算任務相等。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國人民解放軍國防科技大學,未經中國人民解放軍國防科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711475199.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種帶半燈效果的車頂行李架
- 下一篇:車載箱





