[發(fā)明專利]一種用于執(zhí)行向量四則運算的裝置和方法在審
| 申請?zhí)枺?/td> | 202010613576.0 | 申請日: | 2016-04-26 |
| 公開(公告)號: | CN111651203A | 公開(公告)日: | 2020-09-11 |
| 發(fā)明(設計)人: | 陶勁樺;支天;劉少禮;陳天石;陳云霽 | 申請(專利權)人: | 中科寒武紀科技股份有限公司 |
| 主分類號: | G06F9/30 | 分類號: | G06F9/30;G06F17/16 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100191 北京市海淀區(qū)*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 用于 執(zhí)行 向量 四則運算 裝置 方法 | ||
本發(fā)明提供了一種執(zhí)行向量四則運算的裝置及方法,用于配合一套相應的指令集,執(zhí)行向量四則運算,裝置包括存儲單元、寄存器單元和向量四則運算單元,存儲單元中存儲有向量,寄存器單元中存儲有向量存儲的地址,向量四則運算單元根據(jù)配套指令在寄存器單元中獲取向量地址,然后,根據(jù)該向量地址在存儲單元中獲取相應的向量,接著,根據(jù)獲取的向量進行向量四則運算,得到運算結果。本發(fā)明將參與計算的向量數(shù)據(jù)暫存在高速暫存存儲器上,使得向量四則運算過程中可以更加靈活有效地支持不同寬度的數(shù)據(jù),提升包含大量向量四則運算應用的執(zhí)行性能。
技術領域
本發(fā)明涉及一種向量四則運算裝置及方法,用于根據(jù)向量四則運算指令高效靈活地執(zhí)行向量四則運算,能夠很好地解決當前計算機領域越來越多的算法包含大量向量四則運算的問題。
背景技術
在已有的計算機領域應用中,與向量運算相關的應用十分普遍。以目前的熱門應用領域人工智能中的主流算法機器學習算法為例,幾乎所有已有的經典算法中都含有大量的向量四則運算。向量四則運算是指對向量的對應分量進行加減乘除這四種運算。具體來說,對于兩個向量a=[a1,a2,…,an]和b=[b1,b2,…,bn],向量加法定義為:a+b=[a1+b1,a2+b2,…,an+bn],向量減法定義為:a-b=[a1-b1,a2-b2,…,an-bn],向量乘法定義為:[a1*b1,a2*b2,…,an*bn]向量除法定義為:[a1/b1,a2/b2,…,an/bn]。
在現(xiàn)有技術中,一種進行向量四則運算的已知方案是使用通用處理器,該方法通過通用寄存器堆和通用功能部件來執(zhí)行通用指令,從而執(zhí)行向量四則運算。然而,該方法的缺點之一是單個通用處理器多用于標量計算,在進行向量四則運算時運算性能較低。而使用多個通用處理器并行執(zhí)行時,通用處理器之間的相互通訊又有可能成為性能瓶頸。在另一種現(xiàn)有技術中,使用圖形處理器(GPU)來進行向量計算,其中,通過使用通用寄存器堆和通用流處理單元執(zhí)行通用SIMD指令來進行向量四則運算。然而,上述方案中,GPU片上緩存太小,在進行大規(guī)模向量四則運算時需要不斷進行片外數(shù)據(jù)搬運,片外帶寬成為了主要性能瓶頸。在另一種現(xiàn)有技術中,使用專門定制的向量四則運算裝置來進行向量計算,其中,使用定制的寄存器堆和定制的處理單元進行向量四則運算。然而,目前已有的專用向量四則運算裝置受限于寄存器堆,不能夠靈活地支持不同長度的向量四則運算。
發(fā)明內容
(一)要解決的技術問題
本發(fā)明的目的在于,提供一種向量四則運算裝置及方法,解決現(xiàn)有技術中存在的受限于片間通訊、片上緩存不夠、支持的向量長度不夠靈活等問題。
(二)技術方案
本發(fā)明提供一種向量四則運算裝置,用于根據(jù)向量四則運算指令執(zhí)行向量四則運算,包括:
存儲單元,用于存儲向量;
寄存器單元,用于存儲向量地址,其中,向量地址為向量在存儲單元中存儲的地址;
向量四則運算單元,用于獲取向量四則運算指令,根據(jù)向量四則運算指令在寄存器單元中獲取向量地址,然后,根據(jù)該向量地址在存儲單元中獲取相應的向量,接著,根據(jù)獲取的向量進行向量四則運算,得到向量四則運算結果。
(三)有益效果
本發(fā)明提供的向量四則運算裝置及方法,將參與計算的向量數(shù)據(jù)暫存在高速暫存存儲器(Scratchpad Memory)上。在僅發(fā)送同一條指令的情況下,向量四則運算單元中可以更加靈活有效地支持不同寬度的數(shù)據(jù),并可以解決數(shù)據(jù)存儲中的相關性問題,從而提升了包含大量向量計算任務的執(zhí)行性能,本發(fā)明采用的指令具有精簡的格式,使得指令集使用方便、支持的向量長度靈活。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中科寒武紀科技股份有限公司,未經中科寒武紀科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010613576.0/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 以注射方式執(zhí)行死刑的自動執(zhí)行車的執(zhí)行床
- 過程執(zhí)行裝置、過程執(zhí)行方法以及過程執(zhí)行程序
- 用以執(zhí)行跳舞電子游戲的執(zhí)行系統(tǒng)及其執(zhí)行方法
- 策略執(zhí)行系統(tǒng)及其執(zhí)行方法
- 腳本執(zhí)行系統(tǒng)和腳本執(zhí)行方法
- 命令執(zhí)行設備、命令執(zhí)行系統(tǒng)、命令執(zhí)行方法以及命令執(zhí)行程序
- 程序執(zhí)行裝置、程序執(zhí)行系統(tǒng)以及程序執(zhí)行方法
- 處理執(zhí)行設備和由該處理執(zhí)行設備執(zhí)行的方法
- 有序任務的執(zhí)行方法、執(zhí)行裝置和執(zhí)行系統(tǒng)
- 執(zhí)行器(閥門執(zhí)行器)





