[發明專利]用于深度神經網絡的計算優化機制在審
申請號: | 201810368545.6 | 申請日: | 2018-04-23 |
公開(公告)號: | CN108734274A | 公開(公告)日: | 2018-11-02 |
發明(設計)人: | P·薩蒂;N·斯里尼瓦薩;陳峰;J·雷;B·J·阿什博;N·C·加洛泊凡博列斯;E·努維塔蒂;B·文布;T-H·林;K·辛哈;R·巴瑞克;S·S·巴格索克希;J·E·高茨施里奇;A·考克;N·R·薩蒂什;F·阿赫巴里;D·金;W·付;T·T·施呂斯列爾;J·B·馬斯特羅納爾德;L·L·赫德;J·H·費特;J·S·波爾斯;A·T·萊克;K·瓦德亞納桑;D·伯克;S·馬余蘭;A·R·阿普 | 申請(專利權)人: | 英特爾公司 |
主分類號: | G06N3/04 | 分類號: | G06N3/04;G06N3/08;G06T1/20 |
代理公司: | 上海專利商標事務所有限公司 31100 | 代理人: | 張欣;黃嵩泉 |
地址: | 美國加利*** | 國省代碼: | 美國;US |
權利要求書: | 查看更多 | 說明書: | 查看更多 |
摘要: | |||
搜索關鍵詞: | 處理單元 神經網絡 優化 | ||
1.一種用于促進計算優化的裝置,所述裝置包括:
多個處理單元,所述多個處理單元各自包括多個執行單元(EU),其中,所述多個EU包括第一EU類型和第二EU類型。
2.如權利要求1所述的裝置,其特征在于,所述多個處理單元包括:
第一處理單元,所述第一處理單元包括所述第一類型的多個EU;以及
第二處理單元,所述第二處理單元包括所述第二類型的多個EU。
3.如權利要求1所述的裝置,其特征在于,所述多個處理單元包括:
第一處理單元,所述第一處理單元包括:
所述第一類型的第一組EU;以及
所述第二類型的第二組EU;以及
第二處理單元,所述第二處理單元包括:
所述第一類型的第三組EU;以及
所述第二類型的第四組EU。
4.如權利要求1所述的裝置,進一步包括計算邏輯,所述計算邏輯用于選擇要被實現以用于執行工作負荷的EU。
5.如權利要求4所述的裝置,其特征在于,所述計算邏輯選擇所述第一類型的EU以處理第一類型的應用工作負荷,并且選擇所述第二類型的EU以處理第二類型的應用工作負荷。
6.如權利要求1所述的裝置,進一步包括存儲器,其中,所述多個處理單元被包括在所述存儲器中。
7.如權利要求6所述的裝置,其特征在于,所述存儲器包括高帶寬存儲器(HBM)。
8.如權利要求7所述的裝置,其特征在于,所述HBM包括:
第一存儲器信道;以及
被包括在所述第一存儲器信道中的第一處理單元。
9.如權利要求1所述的裝置,進一步包括寄存器堆,所述寄存器堆被實現以用于執行矩陣-向量變換。
10.如權利要求1所述的裝置,進一步包括共享本地存儲器(SLM),所述共享本地存儲器被實現以用于執行矩陣-向量變換。
11.一種圖形處理器,包括:
多個處理單元,所述多個處理單元各自包括多個執行單元(EU),其中,所述多個EU包括第一EU類型和第二EU類型;
第一處理單元,所述第一處理單元包括第一組執行單元(EU);以及
第二處理單元,所述第二處理單元包括第二組EU,其中,所述第一和第二組EU由第一EU類型和第二EU類型構成。
12.如權利要求11所述的圖形處理器,其特征在于,所述第一組EU包括所述第一類型的多個EU,并且所述第二組EU包括所述第二類型的多個EU。
13.如權利要求11所述的圖形處理器,其特征在于,所述第一和第二組EU各自包括第一類型的一個或多個EU和第二類型的一個或多個EU。
14.如權利要求11所述的圖形處理器,進一步包括計算邏輯,所述計算邏輯用于選擇要被實現以用于執行工作負荷的EU。
15.如權利要求14所述的圖形處理器,其特征在于,所述計算邏輯選擇所述第一類型的EU以處理第一類型的應用工作負荷,并且選擇所述第二類型的EU以處理第二類型的應用工作負荷。
16.如權利要求11所述的圖形處理器,進一步包括存儲器,其中,所述多個處理單元被包括在所述存儲器中。
17.如權利要求16所述的圖形處理器,其特征在于,所述存儲器包括高帶寬存儲器(HBM)。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于英特爾公司,未經英特爾公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810368545.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種應用于神經網絡的SQRT激活方法
- 下一篇:硬件IP優化卷積神經網絡