[發(fā)明專利]一種基于預(yù)量化和縮放系數(shù)剪枝的卷積神經(jīng)網(wǎng)絡(luò)壓縮方法在審
| 申請(qǐng)?zhí)枺?/td> | 202110625812.5 | 申請(qǐng)日: | 2021-06-04 |
| 公開(kāi)(公告)號(hào): | CN113570055A | 公開(kāi)(公告)日: | 2021-10-29 |
| 發(fā)明(設(shè)計(jì))人: | 樊春曉;宋光明;胡洲;趙公方 | 申請(qǐng)(專利權(quán))人: | 合肥工業(yè)大學(xué) |
| 主分類號(hào): | G06N3/08 | 分類號(hào): | G06N3/08;G06N3/04 |
| 代理公司: | 安徽申策知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 34178 | 代理人: | 程艷梅 |
| 地址: | 230002 *** | 國(guó)省代碼: | 安徽;34 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 量化 縮放 系數(shù) 剪枝 卷積 神經(jīng)網(wǎng)絡(luò) 壓縮 方法 | ||
1.一種基于預(yù)量化和縮放系數(shù)剪枝的卷積神經(jīng)網(wǎng)絡(luò)壓縮方法,其特征在于,包括以下步驟:
S1、預(yù)精簡(jiǎn)階段:首先通過(guò)提出的約束損失函數(shù)對(duì)預(yù)訓(xùn)練卷積神經(jīng)模型進(jìn)行預(yù)量化,訓(xùn)練結(jié)束后網(wǎng)絡(luò)中的權(quán)值會(huì)被約束為預(yù)量化值,同時(shí)在訓(xùn)練中引入稀疏正則化損失函數(shù)對(duì)批標(biāo)準(zhǔn)化層的通道縮放系數(shù)進(jìn)行稀疏化處理,使縮放系數(shù)在訓(xùn)練中逐漸趨于0,在接下來(lái)的剪枝階段中用縮放系數(shù)來(lái)評(píng)估通道重要性,為后續(xù)剪枝操作做準(zhǔn)備;
S2、剪枝階段:首先對(duì)預(yù)精簡(jiǎn)階段中通道縮放系數(shù)進(jìn)行排序統(tǒng)計(jì),設(shè)置好剪枝比率后,剪枝掉低于閾值的縮放系數(shù)所對(duì)應(yīng)的通道,從而得到剪枝后模型;
S3、量化階段:首先對(duì)剪枝網(wǎng)絡(luò)微調(diào)訓(xùn)練并預(yù)量化網(wǎng)絡(luò)權(quán)值,接著將剪枝網(wǎng)絡(luò)中預(yù)量化權(quán)值量化為{±2n}表示的低精度值,并重訓(xùn)練網(wǎng)絡(luò)的第一層和最后一層來(lái)彌補(bǔ)量化帶來(lái)的精度損失,得到最終的壓縮模型。
2.根據(jù)權(quán)利要求1所述的一種基于預(yù)量化和縮放系數(shù)剪枝的卷積神經(jīng)網(wǎng)絡(luò)壓縮方法,其特征在于:所述步驟S1預(yù)精簡(jiǎn)階段的目的是為了找到一個(gè)適應(yīng)量化的剪枝網(wǎng)絡(luò),稱為預(yù)精簡(jiǎn)網(wǎng)絡(luò)。
3.根據(jù)權(quán)利要求1所述的一種基于預(yù)量化和縮放系數(shù)剪枝的卷積神經(jīng)網(wǎng)絡(luò)壓縮方法,其特征在于:所述步驟S1中的約束損失函數(shù),可以將網(wǎng)絡(luò)權(quán)值限制在集合{±2n+ε}中,其中ε為一個(gè)極小的值。
4.根據(jù)權(quán)利要求1所述的一種基于預(yù)量化和縮放系數(shù)剪枝的卷積神經(jīng)網(wǎng)絡(luò)壓縮方法,其特征在于:所述步驟S2中,由于在預(yù)精簡(jiǎn)訓(xùn)練階段中尋找剪枝結(jié)構(gòu)時(shí)考慮量化對(duì)剪枝的影響,因此可以提高剪枝的有效性,使剪枝結(jié)構(gòu)更適應(yīng)于量化值,從而提高后續(xù)量化的性能表現(xiàn);此外,預(yù)量化值降低后續(xù)量化帶來(lái)的噪音并減少量化帶來(lái)的精度損失。
5.根據(jù)權(quán)利要求1所述的一種基于預(yù)量化和縮放系數(shù)剪枝的卷積神經(jīng)網(wǎng)絡(luò)壓縮方法,其特征在于:所述步驟S2中的剪枝是對(duì)預(yù)訓(xùn)練網(wǎng)絡(luò)中低于閾值的縮放參數(shù)所對(duì)應(yīng)的通道進(jìn)行剪枝,然后得到剪枝網(wǎng)絡(luò),接著重訓(xùn)練剪枝網(wǎng)絡(luò)來(lái)恢復(fù)精度。為鑒別出不重要通道,引入通道縮放系數(shù)γ,讓每一個(gè)通道對(duì)應(yīng)一個(gè)γ,由于每個(gè)通道縮放系數(shù)會(huì)乘以此通道的輸出,因此當(dāng)通道的γ趨于0時(shí)此通道輸出也趨于0,即表示此通道不重要,可以剪枝掉低于閾值的縮放系數(shù)對(duì)應(yīng)的通道。
6.根據(jù)權(quán)利要求1所述的一種基于預(yù)量化和縮放系數(shù)剪枝的卷積神經(jīng)網(wǎng)絡(luò)壓縮方法,其特征在于:所述步驟S3的量化階段,對(duì)剪枝后網(wǎng)絡(luò)進(jìn)行重訓(xùn)練并預(yù)量化,最終將網(wǎng)絡(luò)中預(yù)量化權(quán)值量化到集合Q={±2n|n∈Z}中,同時(shí)重訓(xùn)練網(wǎng)絡(luò)的第一層和最后一層以彌補(bǔ)量化帶來(lái)的精度損失。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于合肥工業(yè)大學(xué),未經(jīng)合肥工業(yè)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110625812.5/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 基于位平面的不等長(zhǎng)的量化/反量化方法
- 反量化圖像的方法和設(shè)備以及解碼圖像的方法和設(shè)備
- 量化處理方法及裝置
- 用于對(duì)線性預(yù)測(cè)系數(shù)進(jìn)行量化的方法和裝置及用于反量化的方法和裝置
- 量化開(kāi)發(fā)人員代碼質(zhì)量的方法和裝置
- 一種圖像云儲(chǔ)存設(shè)備
- 一種神經(jīng)網(wǎng)絡(luò)權(quán)重量化方法和神經(jīng)網(wǎng)絡(luò)權(quán)重量化裝置
- 量化器與量化方法
- 編碼方法及其設(shè)備以及解碼方法及其設(shè)備
- 量化參數(shù)處理方法及裝置
- 生成系數(shù)類型數(shù)據(jù)或系數(shù)數(shù)據(jù)的裝置、方法
- 串?dāng)_系數(shù)估計(jì)裝置和串?dāng)_系數(shù)估計(jì)方法
- 排放系數(shù)計(jì)算器與排放系數(shù)計(jì)算方法
- 摩擦系數(shù)估計(jì)設(shè)備和摩擦系數(shù)估計(jì)方法
- 吸隔音系數(shù)試樣及阻尼系數(shù)試樣取樣裝置
- 用于系數(shù)掃描的系數(shù)群及系數(shù)譯碼
- 導(dǎo)熱系數(shù)測(cè)量裝置以及導(dǎo)熱系數(shù)測(cè)量方法
- 一種PID參數(shù)自整定方法
- 變換系數(shù)計(jì)算裝置、變換系數(shù)計(jì)算方法及變換系數(shù)計(jì)算程序
- 導(dǎo)熱系數(shù)儀





