[發(fā)明專利]一種提高卷積運(yùn)算效率的數(shù)據(jù)擺放方法在審
| 申請(qǐng)?zhí)枺?/td> | 202110157998.6 | 申請(qǐng)日: | 2021-02-04 |
| 公開(公告)號(hào): | CN112836803A | 公開(公告)日: | 2021-05-25 |
| 發(fā)明(設(shè)計(jì))人: | 不公告發(fā)明人 | 申請(qǐng)(專利權(quán))人: | 珠海億智電子科技有限公司 |
| 主分類號(hào): | G06N3/04 | 分類號(hào): | G06N3/04 |
| 代理公司: | 廣州科粵專利商標(biāo)代理有限公司 44001 | 代理人: | 鄧潮彬;黃培智 |
| 地址: | 519080 廣東省珠海市高新區(qū)*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 提高 卷積 運(yùn)算 效率 數(shù)據(jù) 擺放 方法 | ||
1.一種提高卷積運(yùn)算效率的數(shù)據(jù)擺放方法,其特征在于,包括以下步驟:
w方向數(shù)據(jù)緩存模塊從塊數(shù)據(jù)緩存sram中取出特定數(shù)量的w方向特征值、h方向特征值和c方向特征值,根據(jù)第一預(yù)設(shè)數(shù)目將所述w方向特征值依次擺放到sram子模塊中,根據(jù)第二預(yù)設(shè)數(shù)目將所述h方向特征值依次擺放到sram子模塊中,根據(jù)第三預(yù)設(shè)數(shù)目將所述c方向特征值依次擺放到sram子模塊中,通過迭代展開為一維數(shù)據(jù)保存在n個(gè)sram子模塊中;
將sram子模塊中的一維數(shù)據(jù)發(fā)送到fifo緩存模塊;
將一維數(shù)據(jù)從fifo緩存模塊發(fā)送到數(shù)據(jù)拼湊模塊,根據(jù)filter窗口的尺寸對(duì)所述一維數(shù)據(jù)進(jìn)行對(duì)應(yīng)的重排序;
其中,w為輸入寬度,h為輸入高度,c為通道數(shù)量,kw為卷積核的寬度,kh為卷積核的高度,sh為卷積核高度方向的步長,sw為卷積核寬度方向的步長。
2.如權(quán)利要求1所述的提高卷積運(yùn)算效率的數(shù)據(jù)擺放方法,其特征在于,所述特定數(shù)量根據(jù)所述擺放的處理速度、kw、kh、c、sw和sh的支持范圍,以及平均每個(gè)周期要求完成的卷積核乘累加運(yùn)算組數(shù)的最低要求共同決定。
3.如權(quán)利要求1所述的提高卷積運(yùn)算效率的數(shù)據(jù)擺放方法,其特征在于,所述第一預(yù)設(shè)數(shù)目、所述第二預(yù)設(shè)數(shù)目和所述第三預(yù)設(shè)數(shù)目在迭代過程數(shù)目變化或不變化。
4.如權(quán)利要求1所述的提高卷積運(yùn)算效率的數(shù)據(jù)擺放方法,其特征在于,所述sram子模塊和所述fifo緩存模塊的數(shù)量一致。
5.如權(quán)利要求1所述的提高卷積運(yùn)算效率的數(shù)據(jù)擺放方法,其特征在于,filter窗口的尺寸包括kw、kh和sh,且定義sw=1。
6.如權(quán)利要求1所述的提高卷積運(yùn)算效率的數(shù)據(jù)擺放方法,其特征在于,所述重排序具體為:所述一維數(shù)據(jù)根據(jù)filter窗口的尺寸排序,分為c=1、c=4、c=8和c=16*n四類,當(dāng)c=1,根據(jù)kw方向的特征值的不同數(shù)目,從每個(gè)所述fifo緩存模塊中取出對(duì)應(yīng)數(shù)目a的特征值,以拼湊出最大m個(gè)pixel特征值為限,且拼湊kw方向相鄰的特征值;當(dāng)c=4,根據(jù)kw方向的特征值的不同數(shù)目,從每個(gè)所述fifo緩存模塊中取出對(duì)應(yīng)數(shù)目a1的特征值,a1為c的倍數(shù),以拼湊出最大m個(gè)pixel特征值為限,且拼湊kw方向相鄰的特征值,當(dāng)kw=3,取出對(duì)應(yīng)的數(shù)目a2,a2=(m/3)取整數(shù);當(dāng)c=8或c=16*n,根據(jù)kw方向的特征值的不同數(shù)目,從每個(gè)所述fifo緩存模塊中取出對(duì)應(yīng)數(shù)目a3或a4的特征值,拼湊出最大m個(gè)pixel特征值,且拼湊kw方向相鄰的兩個(gè)特征值。
7.如權(quán)利要求6所述的提高卷積運(yùn)算效率的數(shù)據(jù)擺放方法,其特征在于,若所述sram子模塊的數(shù)量不足以重排序出wa_max個(gè)特征值組;
對(duì)于當(dāng)c=16n,wa≤(wa_max/2)且wa>(wa_max/4),在c通道方向按照g1個(gè)特征值進(jìn)行將特征值組拆分;
當(dāng)c<16,wa≤(wa_max/2),ha>1,在kernal的h方向?qū)蓚€(gè)特征值組同時(shí)輸入卷積乘累加陣列;
當(dāng)c=16n,ha>1,wa≤(wa_max/4),在c通道方向按g1個(gè)特征值劃分并且在kernal的h方向?qū)蓚€(gè)特征值組同時(shí)輸入卷積乘累加陣列;
其中,wa為b個(gè)sram子模塊的組合出來的特征值個(gè)數(shù),wa_max為卷積每個(gè)周期能處理最大的wa數(shù)目,ha為每個(gè)sram子模塊能組合出來h方向的特征值個(gè)數(shù)。
8.如權(quán)利要求7所述的提高卷積運(yùn)算效率的數(shù)據(jù)擺放方法,其特征在于,若wa的數(shù)目不是2或者4的倍數(shù),當(dāng)wa<(wa_max/2),且當(dāng)ha≥n1,將下一周期處理的kernal的h方向的部分wa數(shù)目,放到當(dāng)前周期處理;
若wa的數(shù)目不是2或者4的倍數(shù),當(dāng)wa<(wa_max/4),且當(dāng)ha≥n1,將下一周期處理的kernal的h方向的部分wa數(shù)目,放到當(dāng)前周期處理,同時(shí)在c通道方向按照g1個(gè)特征值進(jìn)行將特征值組拆分。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于珠海億智電子科技有限公司,未經(jīng)珠海億智電子科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110157998.6/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 卷積運(yùn)算處理方法及相關(guān)產(chǎn)品
- 一種卷積神經(jīng)網(wǎng)絡(luò)的計(jì)算方法及系統(tǒng)
- 卷積運(yùn)算方法及系統(tǒng)
- 卷積運(yùn)算方法、裝置及系統(tǒng)
- 深度神經(jīng)網(wǎng)絡(luò)裁剪方法、裝置及電子設(shè)備
- 基于卷積神經(jīng)網(wǎng)絡(luò)的圖像處理方法和圖像處理裝置
- 卷積神經(jīng)網(wǎng)絡(luò)及基于卷積神經(jīng)網(wǎng)絡(luò)的圖像處理方法
- 一種圖像處理方法、裝置以及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 用于卷積神經(jīng)網(wǎng)絡(luò)的卷積運(yùn)算裝置
- 基于FPGA實(shí)現(xiàn)圖像識(shí)別的方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





