[發明專利]神經網絡處理裝置及其執行矩陣相乘指令的方法在審
| 申請號: | 201810912879.5 | 申請日: | 2018-08-08 |
| 公開(公告)號: | CN109101272A | 公開(公告)日: | 2018-12-28 |
| 發明(設計)人: | 王秉睿;周聖元;張堯 | 申請(專利權)人: | 上海寒武紀信息科技有限公司 |
| 主分類號: | G06F9/30 | 分類號: | G06F9/30;G06N3/063 |
| 代理公司: | 廣州三環專利商標代理有限公司 44202 | 代理人: | 郝傳鑫;熊永強 |
| 地址: | 201306 上海*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 矩陣相乘 指令 矩陣相乘運算 寄存器單元 存儲器 運算單元 操作碼 相乘 神經網絡處理 存儲器存儲 處理裝置 存儲矩陣 計算開銷 運算數據 操作域 功耗 向量 解析 | ||
1.一種處理裝置,用于根據矩陣相乘指令執行運算,其特征在于,所述處理裝置包括:存儲器、運算單元、控制單元和寄存器單元;
所述寄存器單元,用于存儲矩陣相乘指令;所述矩陣相乘指令包括操作碼和操作域,所述操作碼用于指示進行矩陣相乘運算;所述操作域包括所述參與矩陣相乘運算的數據的首地址和所述參與矩陣相乘運算的數據中部分數據或者全部數據的索引的地址;
所述存儲器,用于存儲參與矩陣相乘運算的數據;
所述控制單元,用于從所述寄存器單元中獲取所述矩陣相乘指令,解析所述矩陣相乘指令,以得到所述操作碼和操作域;根據所述操作域從所述存儲器中獲取所述參與矩陣相乘運算的數據和所述參與矩陣相乘運算的數據中部分數據或者全部數據的索引;并將所述參與矩陣相乘運算的數據傳輸至所述運算單元;
所述運算單元,用于對所述參與矩陣相乘運算的數據進行矩陣相乘運算。
2.根據權利要求1所述的處理裝置,其特征在于,當所述矩陣相乘指令為第一矩陣相乘指令時,所述操作碼用于指示進行第一矩陣相乘運算,所述操作域包括:稀疏矩陣A3的索引表示方式、第三矩陣的存儲格式、稀疏矩陣A3的變換信息、矩陣A4的變換信息、常數M、常數N、常數K、第十三標量的首地址、第十四標量的首地址、稀疏矩陣A3的各行元素的首地址、稀疏矩陣A3的各行索引的首地址、稀疏矩陣A3的低維長度、矩陣A4的首地址、矩陣A4的低維長度;所述矩陣A5的首地址、矩陣A5的低維長度;其中,所述常數M為所述矩陣op(A3)和所述矩陣A5的行數,所述常數N為所述矩陣op(A4)和所述矩陣A5的列數,所述常數K為所述矩陣op(A3)的列數和所述矩陣op(A4)的行數,所述矩陣op(A3)和矩陣op(A4)分別為對所述矩陣A3和矩陣A4進行變換之后得到的矩陣;所述矩陣的存儲格式為行主序時,所述矩陣A3的低維長度、矩陣A4的低維長度和矩陣A5的低維長度均為相鄰兩個行向量之間的首地址間隔;當所述矩陣的存儲格式為列主序時,所述矩陣A3的低維長度、矩陣A4的低維長度和矩陣A5的低維長度均為相鄰兩個列向量之間的首地址間隔;
所述控制單元具體用于:
根據所述稀疏矩陣A3的各行元素的首地址、常數M、所述第三矩陣存儲格式和所述矩陣A3的低維長度從所述存儲器中獲取所述稀疏矩陣A3;根據所述稀疏矩陣A3的轉換信息對所述稀疏矩陣A3進行轉換,以得到op(A3);根據所述稀疏矩陣A3的各行索引的首地址從所述存儲器中獲取所述稀疏矩陣A3的各行索引;根據所述矩陣A4的的首地址、所述第三矩陣的存儲格式和所述矩陣A4的低維長度從所述存儲器中獲取所述矩陣A4;所述矩陣A4中元素的個數為常數N和常數K之積;根據所述矩陣A5的首地址、所述第三矩陣存儲格式和所述矩陣A5的低維長度從所述存儲器中獲取所述矩陣A5;所述矩陣A5中元素的個數為常數M和常數N之積;根據所述稀疏矩陣A3的各行索引的首地址從所述存儲器獲取所述稀疏矩陣A3各行的索引;根據所述稀疏矩陣A3的各行的索引和稀疏矩陣A3的索引表示方式對所述矩陣A4的各列元素進行篩選,以得到稀疏矩陣A4;根據所述稀疏矩陣A3的轉換信息對該稀疏矩陣A3進行變換,以得到所述op(A3);根據所述稀疏矩陣A4的轉換信息對該稀疏矩陣A4進行變換,以得到所述op(A4);根據所述第十三標量的首地址和第十四標量的首地址從所述存儲器中分別獲取所述第十三標量和第十四標量;將所述op(A3)、所述op(A4)、矩陣A5、第十三標量和第十四標量傳輸至所述運算單元;
所述運算單元具體用于:
對所述op(A3)、所述op(A4)、矩陣A5、第十三標量和第十四標量進行矩陣相乘運算。
3.根據權利要求2所述的處理裝置,其特征在于,所述操作域還包括:稀疏矩陣A3的各行元素的個數;
所述控制單元根據所述稀疏矩陣A3的各行元素的首地址、所述矩陣op(A3)的行數、所述第三矩陣存儲格式和所述矩陣A3的低維長度從所述存儲器中獲取所述稀疏矩陣A3,包括:
根據所述稀疏矩陣A3的各行元素的首地址、稀疏矩陣A3的各行元素的個數、所述矩陣op(A3)的行數、所述第三矩陣存儲格式和所述矩陣A3的低維長度從所述存儲器中獲取所述稀疏矩陣A3。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海寒武紀信息科技有限公司,未經上海寒武紀信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810912879.5/1.html,轉載請聲明來源鉆瓜專利網。





