[發明專利]一種用于CNN加速的OPU指令集定義方法有效
| 申請號: | 201910192455.0 | 申請日: | 2019-03-14 |
| 公開(公告)號: | CN110058882B | 公開(公告)日: | 2023-01-06 |
| 發明(設計)人: | 喻韻璇;王銘宇 | 申請(專利權)人: | 深圳市比昂芯科技有限公司 |
| 主分類號: | G06F9/30 | 分類號: | G06F9/30;G06N3/04 |
| 代理公司: | 成都正煜知識產權代理事務所(普通合伙) 51312 | 代理人: | 李龍 |
| 地址: | 518017 廣東省深圳市福保街道福保社*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 用于 cnn 加速 opu 指令 定義 方法 | ||
1.一種用于CNN加速的OPU指令集定義方法,其特征在于:包括定義有條件指令、定義無條件指令和設置指令顆粒度;
定義有條件指令包括如下步驟:
構建有條件指令,有條件指令包括讀存儲指令、寫存儲指令、數據抓取指令、數據后處理指令和計算指令;
設置有條件指令的寄存器和執行方式,執行方式為滿足硬件寫入的觸發條件后執行,寄存器包括參數寄存器和觸發條件寄存器;
設置有條件指令的參數配置方式,配置方式為根據無條件指令進行參數配置;
定義無條件指令包括如下步驟:
定義無條件指令的參數;
定義無條件指令參數的執行方式,執行方式為被讀取后直接執行;
設置指令顆粒度包括如下步驟:
統計CNN網絡和加速需求;
根據統計結果和選擇的并行輸入及輸出通道決定計算模式,并設置指令顆粒度;
所述讀存儲指令包括按模式A1進行讀存儲操作和按模式A2進行讀存儲操作,其顆粒度為每次讀入n個數,n1;
模式A1:從指定地址開始向后讀n個數;
模式A2:根據地址流讀n個數,其中,地址流中地址不連續,三種讀數后操作:1,讀取后無操作;2,讀取后拼接為指定長度;3,讀取后拆分為指定長度;四個讀數操作后片上存儲位置:特征圖存儲模塊,內積參數存儲模塊,偏置參數存儲模塊,指令存儲模塊;
所述讀存儲操作指令可配參數包括起始地址、操作數數量、讀取后處理模式和片上存儲位置;
所述寫存儲指令包括按模式B1進行寫存儲操作和按模式B2進行寫存儲操作,其顆粒度為每次寫出n個數,n1;
模式B1:從指定地址開始向后寫n個數;
模式B2:根據目標地址流寫n個數,其中,地址流中地址不連續;
所述寫存儲操作指令可配參數包括起始地址和操作數數量;
所述數據抓取指令包括根據不同讀取數據模式和數據重組排列模式從片上特征圖存儲器和內積參數存儲器讀取數據操作和對讀取的數據進行重組排列操作,其顆粒度為同時操作64個輸入數據;數據抓取指令可配參數包括讀特征圖存儲器和讀內積參數存儲器,其中,讀特征圖存儲器包括讀數地址約束即最小地址和最大地址、讀數步長和重排模式;讀內積參數存儲器包括讀數地址約束和讀數模式;
所述數據后處理指令包括池化、激活、定點切割、取整、向量對位相加的一種操作或者多種操作,其顆粒度為每次操作64的倍數個數據;數據后處理操作指令可配參數包括池化類型、池化尺寸、激活種類和定點切割位置;
所述計算指令包括根據不同長度向量調配進行向量內積操作,其顆粒度為32,向量內積操作采用的計算基本單元為兩個長度為32的向量內積模塊,計算操作指令可調配參數包括輸出結果數量;
所述無條件指令提供參數更新,參數包括片上存儲特征圖模塊長,寬,通道數、當前層輸入長,寬、當前層輸入通道數,輸出通道數、讀存儲操作起始地址、讀操作模式選擇、寫存儲操作起始地址、寫操作模式選擇、數據抓取模式及約束、設置計算模式、設置池化操作相關參數、設置激活操作相關參數和設置數據移位,剪切取整相關操作。
2.根據權利要求1所述的一種用于CNN加速的OPU指令集定義方法,其特征在于:還包括設置指令序列定義方式,具體為:指令序列若為連續的多條重復指令,則設置單一一條指令,該指令會被反復執行,直至觸發條件寄存器和參數寄存器中內容被更新。
3.根據權利要求1所述的一種用于CNN加速的OPU指令集定義方法,其特征在于:還包括定義指令長度,指令長度為統一長度。
4.根據權利要求1所述的一種用于CNN加速的OPU指令集定義方法,其特征在于:并行輸入及輸出通道對應計算模式的最小單元為32的向量內積。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳市比昂芯科技有限公司,未經深圳市比昂芯科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910192455.0/1.html,轉載請聲明來源鉆瓜專利網。





