[發明專利]用于實現卷積神經網絡的可配置處理器元件陣列在審
| 申請號: | 202011027064.2 | 申請日: | 2020-09-25 |
| 公開(公告)號: | CN113033765A | 公開(公告)日: | 2021-06-25 |
| 發明(設計)人: | 德巴布拉塔·莫哈帕特拉;阿納布·拉哈;高瑟姆·欽雅;劉慧楚;科馬克·布里克;蘭斯·???/a> | 申請(專利權)人: | 英特爾公司 |
| 主分類號: | G06N3/04 | 分類號: | G06N3/04;G06N3/063 |
| 代理公司: | 北京東方億思知識產權代理有限責任公司 11258 | 代理人: | 姜飛 |
| 地址: | 美國加利*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 實現 卷積 神經網絡 配置 處理器 元件 陣列 | ||
本公開涉及用于實現卷積神經網絡的可配置處理器元件陣列。所公開的示例裝置包括處理器元件的陣列,該陣列包括各自具有第一數量的處理器元件的行和各自具有第二數量的處理器元件的列。示例裝置還包括配置寄存器,用于存儲描述符,這些描述符用于將處理器元件的陣列配置為基于與多個張量處理模板中的一個張量處理模板相對應的數據流調度來實現卷積神經網絡的層,處理器元件中的一些處理器元件將基于描述符而被配置為實現上述一個張量處理模板,以對與卷積神經網絡的層相關聯的輸入激活數據和過濾器數據進行操作,以生成與卷積神經網絡的層相關聯的輸出激活數據。示例裝置還包括存儲器,用于存儲上述輸入激活數據、過濾器數據和輸出激活數據。
技術領域
本公開總地涉及神經網絡,并且更具體地涉及用于實現卷積神經網絡的可配置處理器元件陣列。
背景技術
神經網絡已經并且持續被采用作為廣泛技術領域(諸如面部識別、語音識別、導航、市場研究等,僅舉幾例)中的基礎技術解決方案。這樣,在推理算法開發以及用于實現演化的推理算法的硬件平臺開發方面,神經網絡的領域已經并且持續快速增長。諸如深度學習卷積神經網絡之類的神經網絡的網絡層有許多可能的張量形狀,其尺寸隨著現有的神經網絡推理算法被修改和/或新的神經網絡推理算法被開發而持續改變。
發明內容
根據本公開的一方面,提供了一種用于實現卷積神經網絡的裝置,該裝置包括:處理器元件的陣列,該陣列包括行和列,所述行中的各行具有第一數量的處理器元件,所述列中的各列具有第二數量的處理器元件;配置寄存器,用于存儲多個描述符,所述描述符用于將所述處理器元件的陣列配置為基于與多個張量處理模板中的一個張量處理模板相對應的數據流調度來實現所述卷積神經網絡的層,所述處理器元件中的一些處理器元件將基于所述描述符而被配置為實現所述多個張量處理模板中的所述一個張量處理模板,以對與所述卷積神經網絡的所述層相關聯的輸入激活數據和過濾器數據進行操作,以產生與所述卷積神經網絡的所述層相關聯的輸出激活數據;和存儲器,用于存儲與所述卷積神經網絡的所述層相關聯的所述輸入激活數據、所述過濾器數據和所述輸出激活數據。
根據本公開的另一方面,提供了一種計算機可讀介質,包括計算機可讀指令,所述計算機可讀指令當被執行時使至少一個處理器至少執行以下操作:將第一組描述符寫入到配置寄存器,以將處理器元件的陣列配置為基于與多個張量處理模板中的第一個張量處理模板相對應的第一數據流調度來實現卷積神經網絡的第一層,所述陣列包括行和列,所述行中的各行具有第一數量的處理器元件,所述列中的各列具有第二數量的處理器元件,所述第一組描述符用于將所述處理器元件中的一些處理器元件配置為實現所述多個張量處理模板中的所述第一個張量處理模板,以對與所述卷積神經網絡的所述第一層相關聯的輸入激活數據和過濾器數據進行操作,以產生與所述卷積神經網絡的所述第一層相關聯的輸出激活數據;和將第二組描述符寫入到所述配置寄存器,以將所述處理器元件的陣列配置為基于與所述多個張量處理模板中的第二個張量處理模板相對應的第二數據流調度來實現所述卷積神經網絡的第二層,所述第二組描述符用于將所述處理器元件中的所述一些處理器元件配置為實現所述多個張量處理模板中的所述第二個張量處理模板,以對與所述卷積神經網絡的所述第二層相關聯的輸入激活數據和過濾器數據進行操作,以產生與所述卷積神經網絡的所述第二層相關聯的輸出激活數據。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于英特爾公司,未經英特爾公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011027064.2/2.html,轉載請聲明來源鉆瓜專利網。





