[發明專利]運算裝置以及相關產品在審
| 申請號: | 202010301181.7 | 申請日: | 2020-04-16 |
| 公開(公告)號: | CN113537476A | 公開(公告)日: | 2021-10-22 |
| 發明(設計)人: | 不公告發明人 | 申請(專利權)人: | 中科寒武紀科技股份有限公司 |
| 主分類號: | G06N3/063 | 分類號: | G06N3/063;G06N20/00 |
| 代理公司: | 北京林達劉知識產權代理事務所(普通合伙) 11277 | 代理人: | 劉新宇 |
| 地址: | 100191 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 運算 裝置 以及 相關 產品 | ||
本公開涉及一種運算裝置以及相關產品。運算裝置可以包括處理器,處理器可以包括多個處理單元以及存儲單元,多個處理單元用于執行指令序列,存儲單元用于存儲數據,可包括隨機存儲器和寄存器堆。處理器中的多個處理單元既可共用部分存儲空間,例如共用部分RAM存儲空間和寄存器堆,又可同時擁有各自的存儲空間。本公開的運算裝置可以提高進行神經網絡模型的運算時的運算性能。
技術領域
本公開涉及人工智能技術領域,特別是涉及一種運算裝置以及相關產品。
背景技術
在人工智能技術領域,神經網絡算法是最近非常流行的一種機器學習算法,在各種領域中都取得了非常好的效果,比如圖像識別,語音識別,自然語言處理等。
發明內容
基于此,有必要針對上述技術問題,提供一種運算裝置以及相關產品。
根據本公開的一方面,提供了一種運算裝置,所述運算裝置包括:
處理單元、第一存儲單元和第二存儲單元;
所述運算裝置接收外部輸入的輸入數據以及二進制可執行文件,
其中,所述輸入數據包括激活表和待處理的輸入張量,所述運算裝置將激活表存儲至第一存儲單元,將輸入張量存儲至第二存儲單元;
所述處理單元運行所述二進制可執行文件時,從第二存儲單元中讀取輸入張量,對所述輸入張量進行縮放處理得到縮放輸入張量,查找第一存儲單元中的激活表對縮放輸入張量進行激活得到中間激活結果,對中間激活結果進行縮放恢復處理得到激活結果,并將激活結果輸出到第二存儲單元。
根據本公開的另一方面,提供了一種人工智能芯片,所述芯片包括如上所述的運算裝置。
根據本公開的另一方面,提供了一種電子設備,所述電子設備包括如上所述的人工智能芯片。
根據本公開的另一方面,提供了一種板卡,所述板卡包括:存儲器件、接口裝置和控制器件以及如上所述的人工智能芯片;
其中,所述人工智能芯片與所述存儲器件、所述控制器件以及所述接口裝置分別連接;
所述存儲器件,用于存儲數據;
所述接口裝置,用于實現所述人工智能芯片與外部設備之間的數據傳輸;
所述控制器件,用于對所述人工智能芯片的狀態進行監控。
根據本公開的實施例,能夠對輸入激活算子的輸入張量進行縮放,這樣,使得縮放后的輸入張量中的元素的大小縮放到合適的范圍,在通過查找激活表對縮放后的輸入張量進行激活之后得到中間激活結果,再對中間激活結果進行恢復即可得到最終的激活結果。通過本公開的實施例,對輸入張量進行縮放,將輸入張量中的元素縮放到已有激活表能夠覆蓋的范圍,不需要根據輸入張量中元素的實際范圍設置大量的激活表,從而可以避免由于遍歷大量激活表導致的算子性能降低,提高激活算子的性能。
根據下面參考附圖對示例性實施例的詳細說明,本公開的其它特征及方面將變得清楚。
附圖說明
包含在說明書中并且構成說明書的一部分的附圖與說明書一起示出了本公開的示例性實施例、特征和方面,并且用于解釋本公開的原理。
圖1示出根據本公開實施例的處理器的示意圖。
圖2示出根據本公開實施例的運算裝置的框圖。
圖3示出根據本公開一實施例的激活過程的流程圖。
圖4示出根據本公開實施例的板卡的結構框圖。
圖5示出根據本公開實施例的一種電子設備800的框圖。
圖6示出根據本公開實施例的一種電子設備1900的框圖。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中科寒武紀科技股份有限公司,未經中科寒武紀科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010301181.7/2.html,轉載請聲明來源鉆瓜專利網。





