[發明專利]針對基于CNN的立體匹配算法的量化方法在審
| 申請號: | 202010558891.8 | 申請日: | 2020-06-18 |
| 公開(公告)號: | CN111696149A | 公開(公告)日: | 2020-09-22 |
| 發明(設計)人: | 魯志敏;王君鵬;陳松 | 申請(專利權)人: | 中國科學技術大學 |
| 主分類號: | G06T7/593 | 分類號: | G06T7/593;G06N3/04;G06N3/08 |
| 代理公司: | 北京凱特來知識產權代理有限公司 11260 | 代理人: | 鄭立明;韓珂 |
| 地址: | 230026 安*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 針對 基于 cnn 立體 匹配 算法 量化 方法 | ||
1.一種針對基于CNN的立體匹配算法的量化方法,其特征在于,包括:
在推理過程中,采用線性定點化的方式,將浮點形式的權重量化為整數值;
單個卷積運算中,將量化后的輸入特征圖與量化后的權重進行整數運算,整數運算使用累加器進行乘積累加,累加器中引入了帶量化的偏置加法,偏置項使用與權重相同的方式量化;累加器的輸出進入激活層,激活層采用ReLU6()函數將最終輸出控制在設定的范圍內。
2.根據權利要求1所述的采用線性定點化的方式,其特征在于,所述將浮點形式的權重量化為整數值包括:
將浮點形式的權重量化為int8,即位寬為8bit的整數值;其中,第1個bit為符號位,1代表為負數,0代表值為正,第2個bit為整數位;后6個bit為小數位;
量化公式表示為:
xQ=clamp(-(Nlevel-1),(Nlevel-1),xint)
其中,x表示浮點形式的權重,其為實數值;S表示量化參數,round(.)表示四舍五入的函數;N1表示小數位所占位寬,也即N1=6;Nlevel=28-1;xQ表示權重量化后得到的整數值。
3.根據權利要求1所述的采用線性定點化的方式,其特征在于,將量化后的輸入特征圖與量化后的權重進行整數運算包括:
假設浮點形式的特征圖r1與浮點形式的權重r2的大小均為N×N;計算r1與r2的乘積表示為:r3=r1r2;
將矩陣rα第i行第j列元素表示為其中1≤i,j≤N,并且將其量化為Sα的量化參數,量化后的矩陣qα第i行第j列元素表示為則:
根據矩陣乘法的定義:
得到:
其中,k表示矩陣中的列號,1≤k≤N,Sα表示矩陣rα的量化參數;
將q1作為量化后的權重,q2作為量化后的輸入特征圖,q3為整數運算結果;卷積神經網絡下一層中的輸入特征圖是上一層中激活層的輸出,對應的量化參數S是相同的,即S2=S3,則乘法因子M僅與量化參數S1相關;記量化后的權重中小數位所占位寬為N1,則
乘上一個M值后,通過將數據右移N1位即可實現的乘法運算。
4.根據權利要求1或3所述的采用線性定點化的方式,其特征在于,量化后的輸入特征圖與量化后的權重分別為和int12和int8,累加int8和int12的乘積采用一個32bit的累加器;
32bit的累加器中引入帶量化的偏置加法,即將偏置項量化為int16;偏置項量化使用與權重相同的方式,區別在于,偏置項量化時的量化參數S′為權重量化參數S1及輸入特征圖量化參數S2的乘積:其中,N2表示量化后的輸入特征圖中小數位所占位寬。
5.根據權利要求1或2所述的采用線性定點化的方式,其特征在于,激活層采用ReLU6()函數將最終輸出控制在[0,6]之間,則表示整數部分的數據位寬為3bit,首端使用1個bit為符號位,1代表為負數,0代表值為正;末端則使用8bit表示小數位;采用與權重相同的方式量化,區別在于,激活層輸出量化時的量化參數為S”=1/28。
6.根據權利要求1或2所述的采用線性定點化的方式,其特征在于,每一卷積層之后引入了批歸一化層,訓練時作為一個單獨的操作模塊,推理過程將批歸一化層融入至相應的卷積層中一起進行量化,即將批歸一化層參數折疊為卷積層的權重和偏置項;首先,按批處理歸一化參數縮放權重與偏置項:
其中,γ是批處理歸一化的比例參數,是整個批次中卷積結果方差的估計值,μB是整個批次中卷積結果的均值,ε是設定的常數值;
再對于獲得的權重ω:fold與偏置項bias進行量化。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學技術大學,未經中國科學技術大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010558891.8/1.html,轉載請聲明來源鉆瓜專利網。





