[發明專利]一種矩陣計算裝置在審
| 申請號: | 201610037535.5 | 申請日: | 2016-01-20 |
| 公開(公告)號: | CN106991077A | 公開(公告)日: | 2017-07-28 |
| 發明(設計)人: | 陳云霽;張瀟;劉少禮;陳天石 | 申請(專利權)人: | 南京艾溪信息科技有限公司 |
| 主分類號: | G06F17/16 | 分類號: | G06F17/16 |
| 代理公司: | 中科專利商標代理有限責任公司11021 | 代理人: | 宋焰琴 |
| 地址: | 210049 江蘇省*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 矩陣 計算 裝置 | ||
技術領域
本發明涉及一種矩陣運算裝置,用于根據矩陣運算指令執行矩陣運算,能夠很好地解決當前計算機領域越來越多的算法包含大量矩陣運算的問題。
背景技術
當前計算機領域有越來越多的算法涉及到矩陣運算,以人工神經網絡算法為例,多種神經網絡算法中都含有大量的矩陣運算。在神經網絡中,輸出神經元的運算表達式為y=f(wx+b),其中w是矩陣,x、b是矩陣,計算輸出矩陣y的過程為矩陣w與矩陣x相乘,加上矩陣b,然后對得到的矩陣進行激活函數運算(即對矩陣中的每個元素進行激活函數運算)。因此,矩陣運算成為目前各種計算裝置在設計之初都需要考慮的一個重要問題。
在現有技術中,一種進行矩陣運算的已知方案是使用通用處理器,該方法通過通用寄存器堆和通用功能部件來執行通用指令,從而執行矩陣運算。然而,該方法的缺點之一是單個通用處理器多用于標量計算,在進行矩陣運算時運算性能較低。而使用多個通用處理器并行執行時,通用處理器之間的相互通訊又有可能成為性能瓶頸。
在另一種現有技術中,使用圖形處理器(GPU)來進行矩陣計算,其中,通過使用通用寄存器堆和通用流處理單元執行通用SIMD指令來進行矩陣運算。然而,上述方案中,GPU片上緩存太小,在進行大規模矩陣運算時需要不斷進行片外數據搬運,片外帶寬成為了主要性能瓶頸。
在另一種現有技術中,使用專門定制的矩陣運算裝置來進行矩陣計算,其中,使用定制的寄存器堆和定制的處理單元進行矩陣運算。然而,目前已有的專用矩陣運算裝置受限于寄存器堆,不能夠靈活地支持不同長度的矩陣運算。
綜上所述,現有的不管是片上多核通用處理器、片間互聯通用處理器(單核或多核)、還是片間互聯圖形處理器都無法進行高效的矩陣運算,并且這些現有技術在處理矩陣運算問題時存在著代碼量大,受限于片間通訊,片上緩存不夠,支持的矩陣規模不夠靈活等問題。
發明內容
(一)要解決的技術問題
本發明的目的在于,提供一種矩陣運算裝置,解決現有技術中存在的受限于片間通訊、片上緩存不夠、支持的矩陣長度不夠靈活等問題。
(二)技術方案
本發明提供一種矩陣運算裝置,用于根據矩陣運算指令執行矩陣運算,包括:
存儲單元,用于存儲矩陣;
寄存器單元,用于存儲矩陣地址,其中,矩陣地址為矩陣在存儲單元中存儲的地址;
矩陣運算單元,用于獲取矩陣運算指令,根據矩陣運算指令在寄存器單元中獲取矩陣地址,然后,根據該矩陣地址在存儲單元中獲取相應的矩陣,接著,根據獲取的矩陣進行矩陣運算,得到矩陣運算結果。
(三)有益效果
本發明提供的矩陣運算裝置,將參與計算的矩陣數據暫存在高速暫存存儲器上(Scratchpad Memory),使得矩陣運算過程中可以更加靈活有效地支持不同寬度的數據,提升包含大量矩陣計算任務的執行性能,本發明采用的指令具有精簡的格式,使得指令集使用方便、支持的矩陣長度靈活。
附圖說明
圖1是本發明提供的矩陣運算裝置的結構示意圖。
圖2是本發明提供的指令集的格式示意圖。
圖3是本發明實施例提供的矩陣運算裝置的結構示意圖。
圖4是本發明實施例提供的矩陣運算裝置執行矩陣點積指令的流程圖。
圖5為本發明實施例提供的矩陣運算裝置進行冪乘法求解不可規約矩陣最大特征值對應特征向量的流程圖。
圖6為本發明實施例提供的矩陣運算單元的結構示意圖。
具體實施方式
本發明提供一種矩陣計算裝置,包括存儲單元、寄存器單元和矩陣運算單元,存儲單元中存儲有矩陣,寄存器單元中存儲有矩陣存儲的地址矩陣運算單元根據矩陣運算指令在寄存器單元中獲取矩陣地址,然后,根據該矩陣地址在存儲單元中獲取相應的矩陣,接著,根據獲取的矩陣進行矩陣運算,得到矩陣運算結果。本發明將參與計算的矩陣數據暫存在高速暫存存儲器上,使得矩陣運算過程中可以更加靈活有效地支持不同寬度的數據,提升包含大量矩陣計算任務的執行性能。
圖1是本發明提供的矩陣運算裝置的結構示意圖,如圖1所示,矩陣運算裝置包括:
存儲單元,用于存儲矩陣,在一種實施方式中,該存儲單元可以是高速暫存存儲器,能夠支持不同大小的矩陣數據;本發明將必要的計算數據暫存在高速暫存存儲器上(Scratchpad Memory),使本運算裝置在進行矩陣運算過程中可以更加靈活有效地支持不同寬度的數據。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京艾溪信息科技有限公司,未經南京艾溪信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610037535.5/2.html,轉載請聲明來源鉆瓜專利網。





