[發明專利]一種計算單元、陣列、模塊、硬件系統及實現方法在審
| 申請號: | 201910476496.2 | 申請日: | 2019-06-03 |
| 公開(公告)號: | CN110069444A | 公開(公告)日: | 2019-07-30 |
| 發明(設計)人: | 李麗;陳沁雨;傅玉祥;曹華鋒;何書專 | 申請(專利權)人: | 南京寧麒智能計算芯片研究院有限公司 |
| 主分類號: | G06F15/78 | 分類號: | G06F15/78;G06F7/50;G06N3/04;G06N3/063 |
| 代理公司: | 江蘇瑞途律師事務所 32346 | 代理人: | 金龍 |
| 地址: | 210000 江蘇省南京市江*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 計算單元 移除 無效數據 硬件系統 功耗 卷積神經網絡 人工智能算法 輸入圖像數據 車牌識別 累加計算 累加通道 人臉識別 算法數據 硬件加速 智慧城市 智能家居 資源消耗 多通道 吞吐率 乘法 輪轉 復用 卷積 權重 稀疏 移動 應用 | ||
本發明公開了一種計算單元、陣列、模塊、硬件系統及實現方法,屬于人工智能算法硬件加速領域。針對現有技術中存在的稀疏化卷積神經網絡算法數據龐大,計算時間長的問題,本發明在計算單元設計了一種無效數據移除機制,可將無效的權重或輸入圖像數據移除,減少計算時間,降低乘法和累加計算帶來的功耗;設計一種多通道子計算單元,采用復用累加通道機制完成卷積操作,降低資源消耗;在無效數據移除的情況下,本發明還設計了一種供數輪轉機制,可保持計算單元的供數充足;本發明因功耗低、面積小、吞吐率高、識別速度快,適用于移動端的應用,如智能家居、智慧城市,能夠高效完成車牌識別、人臉識別等。
技術領域
本發明涉及人工智能算法硬件加速領域,特別涉及一種計算單元、陣列、模塊、硬件系統及實現方法。
背景技術
卷積神經網絡(Convolutional Neural Network,CNN)是一種前饋神經網絡,在人工智能領域有著廣泛的應用,包括圖像識別、大數據處理、自然語言處理等。為了提高算法的精度,卷積神經網絡的模型結構愈加復雜,深度不斷加大,由此所帶來的模型參數龐大、計算時間過長阻礙了該算法在終端的部署,如智能家居、智能交通等物聯網應用。這些問題引起了對卷積神經網絡的算法和硬件設計的深入研究,以追求低功耗和高吞吐量。
在算法上,一種方法是參數剪枝:結構化剪枝和非結構化剪枝,帶來了權重的稀疏化,ReLU等激活函數也帶來了每層輸出激活圖像數據的稀疏化。另一種方法是參數共享:使用特定量化方法將網絡訓練為量化神經網絡,如二值化或三值化網絡,并確保其算法的效果不會影響應用的實現。
近些年來針對稀疏化卷積神經網絡算法的硬件設計越來越多,但相關研究大多集中在常規的稀疏卷積神經網絡的硬件設計,如對權重矩陣和輸入圖像矩陣進行編碼和解碼,而本發明是針對稀疏化的量化卷積神經網絡設計一種硬件實現方法,常規的編碼技術所帶來的代價遠大于提升的效果本身。
中國專利申請,申請號CN201811486547.1,公開日2019年5月3日,公開了一種針對硬件實現稀疏化卷積神經網絡推斷的加速方法,包括面對稀疏硬件加速架構的分組剪枝參數確定方法、針對稀疏硬件加速架構的分組剪枝訓練方法和針對稀疏化卷積神經網絡前向推斷的部署方法:根據硬件架構中乘法器數量確定分組剪枝的分組長度和剪枝率,基于量級裁剪方式將壓縮率以外的權值進行裁剪,通過增量訓練方式提升剪枝后的網絡準確率及壓縮率,剪枝過的網絡經微調后保存非剪枝位置的權值和索引參數并送入硬件架構下的計算單元中,計算單元同時獲取分組長度的激活值完成稀疏網絡前向推斷。本發明基于硬件架構出發設定算法層面的剪枝參數與剪枝策略,有益于降低稀疏加速器的邏輯復雜度提高稀疏加速器前向推斷的整體效率。該發明雖也從硬件架構出發提升整體效率,但沒有對無效數據進行處理,功耗高,計算時間不夠優化。
發明內容
1.要解決的技術問題
針對現有技術中存在的稀疏化卷積神經網絡算法數據龐大,計算時間長,目前研究大多集中在相關硬件設計,本發明提供了一種計算單元、陣列、模塊、硬件系統及實現方法,可靈活支持多種二值化或三值化稀疏卷積神經網絡的實現,資源利用率高、吞吐率大、功耗低、面積小,適用于終端的應用實現。
2.技術方案
本發明的目的通過以下技術方案實現。
第一方面,提供了一種計算單元,包括一個無效數據模塊、一個緩沖單元組、一個加法器、一個多通道部分、寄存器組以及多個選通器,輸入數據經過無效數據模塊處理后傳輸到緩沖單元組,緩沖單元組對數據緩沖后提供有效數據源給加法器,數據通過加法器后經過多通道部分和寄存器組,最后數據分為正權值部分和負權值部分再通過選通器傳輸到加法器。
更進一步的,無效數據模塊判斷輸入數據是否為零,輸入數據為零判為無效數據跳過計算單元。
更進一步的,無效數據模塊的輸入數據為系統輸入圖像數據或權重數據。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京寧麒智能計算芯片研究院有限公司,未經南京寧麒智能計算芯片研究院有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910476496.2/2.html,轉載請聲明來源鉆瓜專利網。





