[發(fā)明專利]用于神經(jīng)網(wǎng)絡的壓縮和推斷加速的非對稱量化在審
| 申請?zhí)枺?/td> | 202010526606.4 | 申請日: | 2020-06-11 |
| 公開(公告)號: | CN112085154A | 公開(公告)日: | 2020-12-15 |
| 發(fā)明(設計)人: | 楊穎振;趙志彪;趙寶新;浣軍;歐陽劍;王勇;施佳鑫 | 申請(專利權(quán))人: | 百度(美國)有限責任公司 |
| 主分類號: | G06N3/04 | 分類號: | G06N3/04;G06N5/04 |
| 代理公司: | 北京清亦華知識產(chǎn)權(quán)代理事務所(普通合伙) 11201 | 代理人: | 張潤 |
| 地址: | 美國加利福尼亞*** | 國省代碼: | 暫無信息 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 神經(jīng)網(wǎng)絡 壓縮 推斷 加速 對稱 量化 | ||
1.一種用于神經(jīng)網(wǎng)絡的量化的計算機實現(xiàn)的方法,包括:
從用于所述神經(jīng)網(wǎng)絡的層的權(quán)重值中識別極值權(quán)重值的集合,所述極值權(quán)重值的集合包括最大權(quán)重值和最小權(quán)重值;
使用所述極值權(quán)重值的集合和將用于以量化形式表示所述權(quán)重值的位的數(shù)量來獲得用于量化用于所述神經(jīng)網(wǎng)絡的層的所述權(quán)重值的縮放因子;
使用所述極值權(quán)重值中的一個以及所述縮放因子以量化用于所述神經(jīng)網(wǎng)絡的層的所述權(quán)重值;
使用所述縮放因子和來自被用于量化所述層的所述權(quán)重值的所述極值權(quán)重值的集合的極值來獲得用于所述層的偏移值,所述偏移值是整數(shù)值;以及
對于所述層,存儲所述縮放因子、所述偏移值及經(jīng)量化的權(quán)重以在推斷期間使用,其中獲得用于所述層的輸出包括僅使用整數(shù)運算,以通過所述偏移值調(diào)整所述經(jīng)量化的權(quán)重,以及將經(jīng)調(diào)整的經(jīng)量化的權(quán)重值與用于所述層的輸入值相乘。
2.如權(quán)利要求1所述的計算機實現(xiàn)的方法,還包括:
使用用于所述層的所述縮放因子、用于所述層的所述偏移值、用于所述層的所述經(jīng)量化的權(quán)重和輸入值計算用于所述神經(jīng)網(wǎng)絡的層的輸出,其中使用整數(shù)運算以通過所述偏移值調(diào)整所述經(jīng)量化的權(quán)重,以及將所述經(jīng)調(diào)整的經(jīng)量化的權(quán)重值與所述輸入值相乘。
3.如權(quán)利要求1所述的計算機實現(xiàn)的方法,其中所述極值權(quán)重值是所述最大權(quán)重值,以及通過使用整數(shù)運算從所述偏移值減去所述經(jīng)量化的值獲得經(jīng)調(diào)整的經(jīng)量化的權(quán)重值。
4.如權(quán)利要求1所述的計算機實現(xiàn)的方法,其中所述極值權(quán)重值是所述最小權(quán)重值,以及通過使用整數(shù)運算將所述經(jīng)量化的值加到所述偏移值獲得經(jīng)調(diào)整的經(jīng)量化的權(quán)重值。
5.如權(quán)利要求1所述的計算機實現(xiàn)的方法,其中使用所述縮放因子和來自被用于量化用于所述層的所述權(quán)重值的所述極值權(quán)重值的集合的所述極值來獲得用于所述層的為整數(shù)值的偏移值的步驟包括:
通過以所述縮放因子除以來自所述極值權(quán)重值的集合的所述極值獲得商;以及
將所述商轉(zhuǎn)換為整數(shù)值。
6.如權(quán)利要求1所述的計算機實現(xiàn)的方法,還包括:
將權(quán)利要求1的方法用于所述神經(jīng)網(wǎng)絡的兩個或更多個層中的每個層。
7.如權(quán)利要求6所述的計算機實現(xiàn)的方法,其中所述兩個或多個層中的至少多個層是連續(xù)層,以及所述方法還包括:
通過執(zhí)行以下步驟計算用于所述神經(jīng)網(wǎng)絡的所述連續(xù)層的輸出,所述步驟包括:
使用整數(shù)運算以:
針對所述連續(xù)層中的每個層,通過以所述層的所述偏移值調(diào)整所述層的所述經(jīng)量化的權(quán)重值獲得用于所述層的經(jīng)調(diào)整的經(jīng)量化的權(quán)重值的集合;以及
將所述經(jīng)調(diào)整的經(jīng)量化的權(quán)重值的集合與用于所述連續(xù)層的第一層的輸入值相乘在一起以獲得中間乘積;以及
將用于所述連續(xù)層中的每個層的所述縮放因子與所述中間乘積相乘在一起以獲得用于所述連續(xù)層的所述輸出。
8.一種系統(tǒng),包括:
一個或多個處理器;以及
非暫時性計算機可讀介質(zhì),包括一個或多個指令集,所述一個或多個指令集在由所述一個或多個處理器中的至少一個執(zhí)行時,使得如權(quán)利要求1至7中任一項所述的方法的步驟被執(zhí)行。
9.一種非暫時性計算機可讀介質(zhì),包括一個或多個指令序列,所述一個或多個指令序列在由一個或多個處理器執(zhí)行時,使得如權(quán)利要求1至7中任一項所述方法的步驟被執(zhí)行。
該專利技術資料僅供研究查看技術是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于百度(美國)有限責任公司,未經(jīng)百度(美國)有限責任公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010526606.4/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 硬件神經(jīng)網(wǎng)絡轉(zhuǎn)換方法、計算裝置、軟硬件協(xié)作系統(tǒng)
- 生成較大神經(jīng)網(wǎng)絡
- 神經(jīng)網(wǎng)絡的生成方法、生成裝置和電子設備
- 一種舌診方法、裝置、計算設備及計算機存儲介質(zhì)
- 學習神經(jīng)網(wǎng)絡結(jié)構(gòu)
- 脈沖神經(jīng)網(wǎng)絡轉(zhuǎn)換方法及相關轉(zhuǎn)換芯片
- 圖像處理方法、裝置、可讀存儲介質(zhì)和計算機設備
- 一種適應目標數(shù)據(jù)集的網(wǎng)絡模型微調(diào)方法、系統(tǒng)、終端和存儲介質(zhì)
- 用于重構(gòu)人工神經(jīng)網(wǎng)絡的處理器及其操作方法、電氣設備
- 一種圖像神經(jīng)網(wǎng)絡結(jié)構(gòu)的優(yōu)化方法及裝置





