[發明專利]神經網絡運算方法及相關產品在審
| 申請號: | 201910307675.3 | 申請日: | 2019-04-16 |
| 公開(公告)號: | CN111832696A | 公開(公告)日: | 2020-10-27 |
| 發明(設計)人: | 不公告發明人 | 申請(專利權)人: | 上海寒武紀信息科技有限公司 |
| 主分類號: | G06N3/04 | 分類號: | G06N3/04;G06N3/063;G06N3/08 |
| 代理公司: | 廣州三環專利商標代理有限公司 44202 | 代理人: | 郝傳鑫;熊永強 |
| 地址: | 201306 上海*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 神經網絡 運算 方法 相關 產品 | ||
本披露提供一種運算數據的量化的方法及相關產品,該方法包括對神經網絡運算的數據執行量化處理,對處理后的數據進行運算,本申請提供的技術方案具有計算量小,計算效率高,能耗低的優點。
技術領域
本披露涉及神經網絡領域,尤其涉及一種神經網絡運算方法及相關產品。
背景技術
人工神經網絡(Artificial Neural Network,即ANN),是20世紀80年代以來人工智能領域興起的研亢熱點。它從信息處理角度對人腦神經元網絡進行抽象,建立某種簡單模型,按不同的連接方式組成不同的網絡。在工程與學術界也常直接簡稱為神經網絡或類神經網絡。神經網絡是一種運算模型,由大量的節點(或稱神經元)之間相互聯接構成。現有的神經網絡的運算基于CPU(Central Processing Unit,中央處理器)或GPU(英文:Graphics Processing Unit,圖形處理器)來實現神經網絡的推理(即正向運算),此種推理的計算量大,功耗高。
發明內容
本披露實施例提供了一種運算數據的量化方法及相關產品,可降低推理、訓練的計算量,提升計算芯片的處理速度,提高效率。
第一方面,提供一種運算數據的量化方法,所述方法包括如下步驟:
確定運算數據;獲取量化命令,該量化命令包括連續量化精度;依據該運算數據確定該運算數據的量化精度f,依據該量化精度以及量化函數對該運算數據進行量化操作,得到量化后的數據,以使得所述人工智能處理器根據所述量化后的數據執行運算操作。
可選的,所述運算數據包括:輸入神經元A、輸出神經元B、權重W、輸入神經元導數輸出神經元導數權重導數中的一種或任意組合。
可選的,所述依據該量化精度以及量化函數對該運算數據進行量化操作,得到量化后的數據具體包括:
依據連續量化精度f以及運算數據的元素值計算得到量化后的數據。
可選的,所述依據連續量化精度f以及運算數據的元素值計算得到量化后的數據具體包括:
連續定點量化函數為公式(1);
其中,Y為量化后的連續定點數據,f為連續量化精度,σ為取整函數。
可選的,所述取整函數為:向上取整函數、向下取整函數、四舍五入函數或隨機取整函數。
可選的,所述依據該運算數據確定該運算數據的量化精度具體包括:
根據該運算數據絕對值最大值確定f;
或根據該運算數據絕對值最小值確定f;
或根據不同數據類型間關系確定f;
或根據經驗值常量確定f。
可選的,所述根據該運算數據絕對值最大值確定f具體包括:
如該所需的定點數據類型為連續定點數據,通過公式2-1來確定f
其中c為常數,bitnum為量化后的數據的比特位數,amax為運算數據絕對值最大值。可選的,所述根據該運算數據絕對值最小值確定f具體包括:
通過公式2-2確定精度f;
fa=amin*d 公式2-2
其中d為常數,amin為運算數據絕對值最小值。
可選的,所述運算數據絕對值最大值或所述絕對值最小值的確定方式具體包括:
采用所有層分類尋找絕對值最大值或絕對值最小值;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海寒武紀信息科技有限公司,未經上海寒武紀信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910307675.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:非水電解液二次電池用多孔層
- 下一篇:電刷絲結構、電刷模塊結構及其制造方法





