[發(fā)明專利]用于神經(jīng)網(wǎng)絡推理的芯片及加速神經(jīng)網(wǎng)絡推理的方法在審
| 申請?zhí)枺?/td> | 202110336218.4 | 申請日: | 2021-03-29 |
| 公開(公告)號: | CN113138957A | 公開(公告)日: | 2021-07-20 |
| 發(fā)明(設計)人: | 聶玉虎;林龍;崔文朋;史存存;劉瑞;王岳;鄭哲;萬能;汪曉;章海斌 | 申請(專利權)人: | 北京智芯微電子科技有限公司;國網(wǎng)信息通信產(chǎn)業(yè)集團有限公司;國家電網(wǎng)有限公司;全球能源互聯(lián)網(wǎng)研究院有限公司;國網(wǎng)安徽省電力有限公司檢修分公司 |
| 主分類號: | G06F15/78 | 分類號: | G06F15/78;G06N3/04;G06N3/08 |
| 代理公司: | 北京潤平知識產(chǎn)權代理有限公司 11283 | 代理人: | 肖冰濱;王曉曉 |
| 地址: | 100192 北京市海淀區(qū)*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 神經(jīng)網(wǎng)絡 推理 芯片 加速 方法 | ||
1.一種用于神經(jīng)網(wǎng)絡推理的芯片,包括存算單元,其特征在于,所述存算單元包括多個不同輸入長度的存儲計算陣列,多個所述存儲計算陣列用于部署與其輸入長度相對應的卷積核。
2.根據(jù)權利要求1所述的用于神經(jīng)網(wǎng)絡推理的芯片,其特征在于,所述存儲計算陣列上部署的卷積核是經(jīng)過剪枝和聚類的。
3.根據(jù)權利要求1所述的用于神經(jīng)網(wǎng)絡推理的芯片,其特征在于,所述存算單元包括四個存儲計算陣列,四個存儲計算陣列的輸入長度分別為1位、3位、6位、9位。
4.根據(jù)權利要求3所述的用于神經(jīng)網(wǎng)絡推理的芯片,其特征在于,所述1位的存儲計算陣列用于部署1位參數(shù)的卷積核;
所述3位的存儲計算陣列用于部署2位或3位參數(shù)的卷積核;
所述6位的存儲計算陣列用于部署4位至6位參數(shù)的卷積核;
所述9位的存儲計算陣列用于部署7位至9位參數(shù)的卷積核。
5.根據(jù)權利要求1所述的用于神經(jīng)網(wǎng)絡推理的芯片,其特征在于,每個所述存儲計算陣列對應一個卷積核,多個所述存儲計算陣列并行運算。
6.一種加速神經(jīng)網(wǎng)絡推理的方法,基于權利要求1所述的用于神經(jīng)網(wǎng)絡推理的芯片,其特征在于,所述方法包括:
對卷積神經(jīng)網(wǎng)絡的各層卷積核參數(shù)進行剪枝和聚類;
將聚類后的卷積核分配到所述用于神經(jīng)網(wǎng)絡推理的芯片的與所述卷積核的參數(shù)位相對應的存儲計算陣列。
7.根據(jù)權利要求6所述的加速神經(jīng)網(wǎng)絡推理的方法,其特征在于,所述對卷積神經(jīng)網(wǎng)絡的各層卷積核參數(shù)進行剪枝和聚類,包括:
對卷積神經(jīng)網(wǎng)絡的各層卷積核參數(shù)進行剪枝;
對剪枝后的各層卷積核參數(shù)進行量化;
對量化后的各層卷積核參數(shù)進行聚類。
8.根據(jù)權利要求7所述的加速神經(jīng)網(wǎng)絡推理的方法,其特征在于,所述對卷積神經(jīng)網(wǎng)絡的各層卷積核參數(shù)進行剪枝,包括:
獲取所述卷積神經(jīng)網(wǎng)絡的各層卷積核的參數(shù)值,將各層卷積核的小于預設閾值的參數(shù)剪掉。
9.根據(jù)權利要求6所述的加速神經(jīng)網(wǎng)絡推理的方法,其特征在于,所述將聚類后的卷積核分配到所述用于神經(jīng)網(wǎng)絡推理的芯片的與所述卷積核的參數(shù)位相對應的存儲計算陣列,包括:
將1位參數(shù)的卷積核分配到1位的存儲計算陣列;
將2位或3位參數(shù)的卷積核分配到3位的存儲計算陣列;
將4位至6位參數(shù)的卷積核分配到6位的存儲計算陣列;
將7位至9位參數(shù)的卷積核分配到9位的存儲計算陣列。
10.一種存儲介質,其上存儲有計算機程序指令,其特征在于,所述計算機程序指令被執(zhí)行時實現(xiàn)權利要求6-9中任一項所述的加速神經(jīng)網(wǎng)絡推理的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京智芯微電子科技有限公司;國網(wǎng)信息通信產(chǎn)業(yè)集團有限公司;國家電網(wǎng)有限公司;全球能源互聯(lián)網(wǎng)研究院有限公司;國網(wǎng)安徽省電力有限公司檢修分公司,未經(jīng)北京智芯微電子科技有限公司;國網(wǎng)信息通信產(chǎn)業(yè)集團有限公司;國家電網(wǎng)有限公司;全球能源互聯(lián)網(wǎng)研究院有限公司;國網(wǎng)安徽省電力有限公司檢修分公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110336218.4/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字數(shù)據(jù)處理
G06F15-00 通用數(shù)字計算機
G06F15-02 .通過鍵盤輸入的手動操作,以及應用機內程序的計算,例如,袖珍計算器
G06F15-04 .在引入被處理的數(shù)據(jù)的同時,進行編制程序的,例如,在同一記錄載體上
G06F15-08 .應用插接板編制程序的
G06F15-16 .兩個或多個數(shù)字計算機的組合,其中每臺至少具有一個運算器、一個程序器及一個寄存器,例如,用于數(shù)個程序的同時處理
G06F15-18 .其中,根據(jù)計算機本身在一個完整的運行期間內所取得的經(jīng)驗來改變程序的;學習機器
- 硬件神經(jīng)網(wǎng)絡轉換方法、計算裝置、軟硬件協(xié)作系統(tǒng)
- 生成較大神經(jīng)網(wǎng)絡
- 神經(jīng)網(wǎng)絡的生成方法、生成裝置和電子設備
- 一種舌診方法、裝置、計算設備及計算機存儲介質
- 學習神經(jīng)網(wǎng)絡結構
- 脈沖神經(jīng)網(wǎng)絡轉換方法及相關轉換芯片
- 圖像處理方法、裝置、可讀存儲介質和計算機設備
- 一種適應目標數(shù)據(jù)集的網(wǎng)絡模型微調方法、系統(tǒng)、終端和存儲介質
- 用于重構人工神經(jīng)網(wǎng)絡的處理器及其操作方法、電氣設備
- 一種圖像神經(jīng)網(wǎng)絡結構的優(yōu)化方法及裝置





