[發明專利]運算裝置及方法有效
| 申請號: | 201710256444.5 | 申請日: | 2017-04-19 |
| 公開(公告)號: | CN108733625B | 公開(公告)日: | 2021-06-08 |
| 發明(設計)人: | 不公告發明人 | 申請(專利權)人: | 上海寒武紀信息科技有限公司 |
| 主分類號: | G06F17/16 | 分類號: | G06F17/16 |
| 代理公司: | 中科專利商標代理有限責任公司 11021 | 代理人: | 任巖 |
| 地址: | 201203 上海市浦東*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 運算 裝置 方法 | ||
1.一種運算裝置,包括地址存儲模塊、運算控制模塊、運算模塊和數據存儲模塊,其中:
地址存儲模塊,用于存儲運算矩陣的地址信息;
數據存儲模塊,用于存儲原始矩陣數據,并存儲運算后的轉置矩陣;
運算控制模塊,用于直接從所述地址存儲模塊提取所述運算矩陣的地址信息,并根據所述運算矩陣的地址信息分析得到分塊信息;
運算模塊,用于從所述運算控制模塊獲取運算矩陣的地址信息及分塊信息,根據所述運算矩陣的地址信息從所述數據存儲模塊提取運算矩陣,并根據所述分塊信息對所述運算矩陣進行分塊、轉置及合并運算,得到所述運算矩陣的轉置矩陣,并將所述運算矩陣的轉置矩陣反饋至所述數據存儲模塊;
所述運算模塊包括矩陣分塊單元、矩陣運算單元和矩陣合并單元,其中:
矩陣分塊單元:用于從所述運算控制模塊獲取運算矩陣的地址信息及分塊信息,并根據所述運算矩陣的地址信息從所述數據存儲模塊提取運算矩陣,根據所述分塊信息對所述運算矩陣進行分塊,得到n個分塊矩陣;
矩陣運算單元,用于獲取所述n個分塊矩陣,并對所述n個分塊矩陣進行轉置運算,得到所述n個分塊矩陣的轉置矩陣;
矩陣合并單元,用于負責接收并暫時緩存轉置后的分塊矩陣,待所有分塊矩陣都進行完轉置運算后,對n個分塊矩陣的轉置矩陣進行合并運算,得到運算矩陣的轉置矩陣,并將所述運算矩陣的轉置矩陣反饋至所述數據存儲模塊,其中,n為自然數。
2.如權利要求1所述的運算裝置,其中,所述運算模塊還包括緩存單元,用于緩存所述n個分塊矩陣,以供所述矩陣運算單元獲取。
3.如權利要求1或2所述的運算裝置,其中,所述運算控制模塊包括指令處理單元、指令緩存單元和矩陣判斷單元,其中:
指令緩存單元,用于存儲待執行的矩陣運算指令;
指令處理單元,用于從指令緩存單元中獲取矩陣運算指令,對所述矩陣運算指令進行譯碼,并根據所述譯碼后的矩陣運算指令從所述地址存儲模塊中獲取運算矩陣的地址信息;
矩陣判斷單元,用于對所述運算矩陣的地址信息進行分析,得到所述分塊信息。
4.如權利要求3所述的運算裝置,其中,所述運算控制模塊還包括依賴關系處理單元,用于判斷所述譯碼后的矩陣運算指令和運算矩陣的地址信息是否與上一運算存在沖突,若存在沖突,則暫存所述譯碼后的矩陣運算指令和運算矩陣的地址信息;若不存在沖突,則發射所述譯碼后的矩陣運算指令和運算矩陣的地址信息至所述矩陣判斷單元。
5.如權利要求4所述的運算裝置,其中,所述運算控制模塊還包括指令隊列,用于緩存所述存在沖突的譯碼后的矩陣運算指令和運算矩陣的地址信息,當所述沖突消除后,將緩存的所述譯碼后的矩陣運算指令和運算矩陣的地址信息發射至所述矩陣判斷單元。
6.如權利要求4或5所述的運算裝置,其中,所述指令處理單元包括取指單元和譯碼單元,其中:
取指單元,用于從所述指令緩存單元中獲取矩陣運算指令,并將此矩陣運算指令傳輸至所述譯碼單元;
譯碼單元,用于對所述矩陣運算指令進行譯碼,根據該譯碼后的矩陣運算指令從所述地址存儲模塊中提取運算矩陣的地址信息,并將所述譯碼后的矩陣運算指令和提取的運算矩陣的地址信息傳輸至所述依賴關系處理單元。
7.如權利要求6所述的運算裝置,其中,所述裝置還包括輸入輸出模塊,用于向所述數據存儲模塊輸入原始矩陣數據,還用于從所述數據存儲模塊獲取運算后的轉置矩陣,并輸出所述運算后的轉置矩陣。
8.如權利要求7所述的運算裝置,其中,所述地址存儲模塊包括標量寄存器堆或通用內存單元;所述數據存儲模塊包括高速暫存存儲器或通用內存單元;所述運算矩陣的地址信息為矩陣的起始地址信息和矩陣大小信息。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海寒武紀信息科技有限公司,未經上海寒武紀信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710256444.5/1.html,轉載請聲明來源鉆瓜專利網。





