[發明專利]用于稀疏神經網絡加速的架構在審
| 申請號: | 201780081207.8 | 申請日: | 2017-11-17 |
| 公開(公告)號: | CN110121721A | 公開(公告)日: | 2019-08-13 |
| 發明(設計)人: | Y·G·圖拉齊亞;J·賈法里;A·潘達;K·查塔 | 申請(專利權)人: | 高通股份有限公司 |
| 主分類號: | G06N3/063 | 分類號: | G06N3/063;G06N3/04 |
| 代理公司: | 上海專利商標事務所有限公司 31100 | 代理人: | 陳煒;亓云 |
| 地址: | 美國加利*** | 國省代碼: | 美國;US |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 操作數 單元處理 神經網絡 非零 稀疏 計算機可讀介質 硬件加速器 乘法器 加載 零時 隊列 架構 | ||
1.一種用于神經網絡的方法,包括:
為要由乘法累加約簡(MAR)單元處理的操作數對確定所述對的兩個操作數是否都非零;以及
在要由所述MAR單元處理的所述操作數對中的一操作數為零時阻止所述操作數對被加載到所述MAR單元的乘法器。
2.如權利要求1所述的方法,其特征在于,進一步包括在所述操作數對中的兩個操作數都非零時將所述操作數對置于多個隊列中的一個隊列中。
3.如權利要求2所述的方法,其特征在于,非零操作數對被隨機地或以重復的預定次序置于所述多個隊列中。
4.如權利要求2所述的方法,其特征在于,進一步包括:
從所述多個隊列選擇經排隊的操作數對;以及
將所述經排隊的操作數對加載到所述MAR單元的乘法器。
5.如權利要求4所述的方法,其特征在于,所述選擇和所述加載是由仲裁器執行的,所述仲裁器從所述多個隊列隨機選擇操作數對并將所述操作數對加載到所述MAR單元的乘法器。
6.如權利要求4所述的方法,其特征在于,所述選擇和所述加載是由分配器執行的,所述分配器采用一組試探規則從所述多個隊列選擇操作數對并將所述操作數對加載到所述MAR單元的乘法器。
7.如權利要求2所述的方法,其特征在于,進一步包括在特定數目的MAR指令之后同步所述多個隊列。
8.如權利要求7所述的方法,其特征在于,所述同步所述多個隊列包括在所述多個隊列中的每一隊列為空之前阻止將新操作數置于所述多個隊列中。
9.如權利要求7所述的方法,其特征在于,所述特定數目是固定數目或可變數目。
10.如權利要求2所述的方法,其特征在于,所述多個隊列包括特定數目的隊列,其中所述特定數目是基于所述神經網絡的稀疏性來確定的。
11.一種用于神經網絡的裝備,包括:
用于為要由乘法累加約簡(MAR)單元處理的操作數對確定所述對的兩個操作數是否都非零的裝置;以及
用于在要由所述MAR單元處理的所述操作數對中的一操作數為零時阻止所述操作數對被加載到所述MAR單元的乘法器的裝置。
12.如權利要求11所述的裝備,其特征在于,進一步包括用于在所述操作數對中的兩個操作數都非零時將所述操作數對置于多個隊列中的一個隊列中的裝置。
13.如權利要求12所述的裝備,其特征在于,非零操作數對被隨機地或以重復的預定次序置于所述多個隊列中。
14.如權利要求12所述的裝備,其特征在于,進一步包括:
用于從所述多個隊列選擇經排隊的操作數對的裝置;以及
用于將所述經排隊的操作數對加載到所述MAR單元的乘法器的裝置。
15.如權利要求14所述的裝備,其特征在于,所述用于選擇的裝置和所述用于加載的裝置包括仲裁器,所述仲裁器從所述多個隊列隨機選擇操作數對并將所述操作數對加載到所述MAR單元的乘法器。
16.如權利要求14所述的裝備,其特征在于,所述用于選擇的裝置和所述用于加載的裝置包括分配器,所述分配器采用一組試探規則從所述多個隊列選擇操作數對并將所述操作數對加載到所述MAR單元的乘法器。
17.如權利要求12所述的裝備,其特征在于,進一步包括用于在特定數目的MAR指令之后同步所述多個隊列的裝置。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于高通股份有限公司,未經高通股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201780081207.8/1.html,轉載請聲明來源鉆瓜專利網。





