[發(fā)明專利]基于語義分割神經(jīng)網(wǎng)絡模型的任意比特量化方法及設備有效
| 申請?zhí)枺?/td> | 202110756609.1 | 申請日: | 2021-07-05 |
| 公開(公告)號: | CN113487014B | 公開(公告)日: | 2022-08-05 |
| 發(fā)明(設計)人: | 譚黎敏;崔衛(wèi)東;趙釗 | 申請(專利權)人: | 上海西井信息科技有限公司 |
| 主分類號: | G06N3/04 | 分類號: | G06N3/04;G06N3/08;G06N5/04 |
| 代理公司: | 上海隆天律師事務所 31282 | 代理人: | 潘一諾 |
| 地址: | 200050 上海市*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 語義 分割 神經(jīng)網(wǎng)絡 模型 任意 比特 量化 方法 設備 | ||
1.一種基于語義分割神經(jīng)網(wǎng)絡模型的任意比特量化方法,其特征在于,包括:
于預訓練的語義分割浮點網(wǎng)絡模型的設置多個偽量化節(jié)點,所述偽量化節(jié)點用于采集量化信息,所述預訓練的語義分割浮點網(wǎng)絡模型的輸入、各層輸入以及權重以浮點數(shù)表示;
對設置后的語義分割浮點網(wǎng)絡模型進行量化感知訓練;
將所述語義分割浮點網(wǎng)絡模型轉化為語義分割定點網(wǎng)絡模型,所述語義分割定點網(wǎng)絡模型的輸入、各層輸入以及權重以指定比特的定點數(shù)表示,其中,所述偽量化節(jié)點設置于所述預訓練的語義分割浮點網(wǎng)絡模型的各層,所述偽量化節(jié)點包括:輸入量化節(jié)點、權重量化節(jié)點、算子量化節(jié)點以及輸出反量化節(jié)點,所述偽量化節(jié)點的算子量化節(jié)點為卷積量化節(jié)點、加法量化節(jié)點以及乘法量化節(jié)點中的多種,所述加法量化節(jié)點根據(jù)如下公式進行加法量化:
zq=Zz/q+Mx,z/float(xq-Zx/q)+My,z/float(yq-Zy/q)
其中,xq是加法算子的量化形式的一個指定比特的輸入定點數(shù),Zx/q是輸入定點數(shù)xq對應的零點偏差,yq是加法算子的量化形式的另一個指定比特的輸入定點數(shù),Zy/q是輸入定點數(shù)yq對應的零點偏差,zq是加法算子的量化形式的指定比特的輸出定點數(shù),Zz/q是輸出定點數(shù)zq對應的零點偏差,Mx,z/float是輸入定點數(shù)xq和輸出定點數(shù)zq的縮放系數(shù)的比值;My,z/float是輸入定點數(shù)yq和輸出定點數(shù)zq的縮放系數(shù)的比值。
2.如權利要求1所述的基于語義分割神經(jīng)網(wǎng)絡模型的任意比特量化方法,其特征在于,所述輸入量化節(jié)點按如下步驟量化:
根據(jù)輸入浮點數(shù)的所有元素的最大值和最小值、量化區(qū)間的最大值和最小值計算縮放因子和零點偏差;
根據(jù)所述縮放因子和零點偏差將所述輸入浮點數(shù)轉換為指定比特的輸入定點數(shù)。
3.如權利要求2所述的基于語義分割神經(jīng)網(wǎng)絡模型的任意比特量化方法,其特征在于,所述權重量化節(jié)點按與所述輸入量化節(jié)點相同的方式量化權重浮點數(shù)。
4.如權利要求1所述的基于語義分割神經(jīng)網(wǎng)絡模型的任意比特量化方法,其特征在于,所述卷積量化節(jié)點根據(jù)如下公式進行卷積量化:
yq=Zy/q+[M*conv((xq-Zx/q)(wq-Zw/q))]
其中,xq是卷積量化節(jié)點的卷積層的指定比特的輸入定點數(shù),wq是卷積量化節(jié)點的卷積層的指定比特的權重定點數(shù),yq是卷積量化節(jié)點的卷積層的指定比特的輸出定點數(shù),Sx/float是輸入定點數(shù)對應的縮放系數(shù),Sw/float是權重定點數(shù)對應的縮放系數(shù),Sy/float是輸出定點數(shù)對應的縮放系數(shù),M是輸入定點數(shù)和輸出定點數(shù)的縮放系數(shù)的比值。
5.如權利要求2所述的基于語義分割神經(jīng)網(wǎng)絡模型的任意比特量化方法,其特征在于,所述乘法量化節(jié)點根據(jù)如下步驟進行乘法量化:
將浮點乘法系數(shù)轉換為定點乘法系數(shù);
根據(jù)所述定點乘法系數(shù)進行定點乘法。
6.如權利要求1至5任一項所述的基于語義分割神經(jīng)網(wǎng)絡模型的任意比特量化方法,其特征在于,所述語義分割定點網(wǎng)絡模型的輸入、各層輸入以及權重為整數(shù),所述語義分割定點網(wǎng)絡模型部署至現(xiàn)場可編程門陣列或嵌入式平臺。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海西井信息科技有限公司,未經(jīng)上海西井信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110756609.1/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 硬件神經(jīng)網(wǎng)絡轉換方法、計算裝置、軟硬件協(xié)作系統(tǒng)
- 生成較大神經(jīng)網(wǎng)絡
- 神經(jīng)網(wǎng)絡的生成方法、生成裝置和電子設備
- 一種舌診方法、裝置、計算設備及計算機存儲介質
- 學習神經(jīng)網(wǎng)絡結構
- 脈沖神經(jīng)網(wǎng)絡轉換方法及相關轉換芯片
- 圖像處理方法、裝置、可讀存儲介質和計算機設備
- 一種適應目標數(shù)據(jù)集的網(wǎng)絡模型微調方法、系統(tǒng)、終端和存儲介質
- 用于重構人工神經(jīng)網(wǎng)絡的處理器及其操作方法、電氣設備
- 一種圖像神經(jīng)網(wǎng)絡結構的優(yōu)化方法及裝置





