[發明專利]一種存內數值計算加速器及存內數值計算方法在審
| 申請號: | 202010879915.X | 申請日: | 2020-08-27 |
| 公開(公告)號: | CN111984921A | 公開(公告)日: | 2020-11-24 |
| 發明(設計)人: | 李祎;李健聰;繆向水 | 申請(專利權)人: | 華中科技大學 |
| 主分類號: | G06F17/16 | 分類號: | G06F17/16;G06F7/523 |
| 代理公司: | 華中科技大學專利中心 42201 | 代理人: | 李智 |
| 地址: | 430074 湖北*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 數值 計算 加速器 計算方法 | ||
本發明公開了一種存內數值計算加速器及存內數值計算方法,包括外部控制模塊和存內計算模塊;其中,所述存內計算模塊包括非易失性存儲器陣列;基于數值迭代算法和非易失性存儲器的存算一體化特性,由非易失性存儲器陣列執行數據密集型矢量矩陣乘法運算,由外部控制單元執行數值迭代算法的控制,由于大多數數值問題在求解上均可使用含有矢量矩陣乘法運算的數值算法,因此該數值計算加速器可廣泛適用于線性方程的求解、線性方程組的求解、定態/時變偏微分方程的求解、矩陣特征值及特征向量的求解、曲線最小二層擬合問題的求解、線性回歸方程的求解等任務,系統可重構性較高。另外,該存內數值計算加速器可以兼容多種非易失性存儲器,可擴展性較強。
技術領域
本發明屬于模擬電路領域,更具體地,涉及一種存內數值計算加速器及存內數值計算方法。
背景技術
在大數據時代,傳統計算機架構因計算時,大量數據在存儲單元與運算單元之間傳輸導致在處理數據密集型任務時,運算過程產生巨大的能耗,使得使用傳統計算機架構處理數據密集型任務時,運算能效非常低。
基于各種非易失存儲器的存算一體化架構是一種用于處理數據密集型任務的新興計算架構,由于計算過程直接在存儲器中進行,最大限度的降低了運算過程中的數據傳輸,使得存算一體化架構具有很高的計算能效。目前,存算一體架構已在神經形態計算領域取得了顯著的成就,各種基于非易失性存儲器搭建的人工神經網絡證實了存算一體技術的巨大潛力。
然而,同樣作為一種數據密集型任務,基于非易失存儲器的存算一體化技術在執行數值計算加速時,面臨著不小的挑戰,目前,多種基于非易失性存儲器的數值計算加速電路雖然已被提出,但是這些工作大多只能處理一種或兩種任務,而以線性方程組為例,線性方程組本身具有相容方程組,不相容方程組等多種形式,在應用上也具有線性回歸,曲線最小二乘擬合等多種應用。但是現有方程求解器不僅不能兼容各種方程的求解,在應用上也限制在了固定問題上,因此研發一種具有高系統可重構性,高能效的存內數值計算加速器勢在必行。
發明內容
針對現有技術的以上缺陷或改進需求,本發明提供了一種存內數值計算加速器及存內數值計算方法,其目的在于解決現有數學方法與運算架構存在的系統可重構性較低的技術問題。
為實現上述目的,第一方面,提供了一種存內數值計算加速器,包括外部控制模塊和存內計算模塊;其中,存內計算模塊包括非易失性存儲器陣列;
外部控制模塊用于在初始階段,將待求解任務轉換成矩陣X與待求解矢量w相乘的形式;預設矢量rn,依次將矩陣X和矢量rn傳輸到存內計算模塊中;其中,矢量rn與矢量w的維度相同;
存內計算模塊用于在初始階段,將接收到的矩陣X寫入到非易失性存儲器陣列;并在接收到矢量rn后,將其輸入到非易失性存儲器陣列中,實現矩陣X與矢量rn的乘法運算,并將所得乘法運算結果反饋給外部控制模塊;
外部控制模塊還用于在迭代階段,在接收到存內計算模塊反饋回來的乘法運算結果后,判斷是否滿足達到預設迭代次數或者乘法運算結果達到預設精度,若是,則當前矢量rn即為待求解矢量w,停止操作;若否,則更新矢量rn,并將其傳輸到存內計算模塊中;
存內計算模塊還用于在迭代階段,當接收到當前矢量rn時,將其輸入到非易失性存儲器陣列中,實現矩陣X與矢量rn的乘法運算,并將所得乘法運算結果反饋給外部控制模塊。
進一步優選地,外部控制模塊包括第一控制單元和動態隨機存儲器DRAM;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華中科技大學,未經華中科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010879915.X/2.html,轉載請聲明來源鉆瓜專利網。





