[發(fā)明專利]面向申威眾核架構(gòu)的稀疏矩陣存儲(chǔ)方法在審
| 申請(qǐng)?zhí)枺?/td> | 201910898286.2 | 申請(qǐng)日: | 2019-09-23 |
| 公開(公告)號(hào): | CN112540718A | 公開(公告)日: | 2021-03-23 |
| 發(fā)明(設(shè)計(jì))人: | 陳德訓(xùn);李芳;趙朋朋;劉鑫;徐金秀;孫唯哲;陳鑫;郭恒 | 申請(qǐng)(專利權(quán))人: | 無(wú)錫江南計(jì)算技術(shù)研究所 |
| 主分類號(hào): | G06F3/06 | 分類號(hào): | G06F3/06 |
| 代理公司: | 蘇州創(chuàng)元專利商標(biāo)事務(wù)所有限公司 32103 | 代理人: | 王健 |
| 地址: | 214083 江蘇*** | 國(guó)省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 面向 申威眾核 架構(gòu) 稀疏 矩陣 存儲(chǔ) 方法 | ||
1.一種面向申威眾核架構(gòu)的稀疏矩陣存儲(chǔ)方法,其特征在于:所述眾核處理器由4個(gè)異構(gòu)群構(gòu)成,每個(gè)異構(gòu)群包括一個(gè)控制核心、64個(gè)計(jì)算核心構(gòu)成的從核簇、異構(gòu)群接口和存儲(chǔ)控制器,整個(gè)眾核處理器有260個(gè)計(jì)算核心;
所述稀疏矩陣存儲(chǔ)格式包括以下步驟:
S1、將稀疏矩陣按行在申威眾核處理器的核組陣列上分組:設(shè)稀疏矩陣行數(shù)為N,核組陣列的計(jì)算核心為64,每個(gè)計(jì)算核心分到的行數(shù)為64/N,順序分配;
S2、對(duì)組內(nèi)的稀疏矩陣非零元素按列壓縮存儲(chǔ),通過(guò)保存稀疏矩陣每列包含的非零元數(shù)量而對(duì)列坐標(biāo)進(jìn)行壓縮,需要保存列偏移Col_p、行坐標(biāo)Row_i和非零元值Value;
S21、按列的順序記錄矩陣中每個(gè)非零元素:
S211、記錄每一列第一個(gè)非零元的列偏移Col_p,并在列偏移的最后補(bǔ)充矩陣總的非零元個(gè)數(shù);
S212、記錄每個(gè)非零元素的行坐標(biāo)Row_i;
S213、記錄每個(gè)非零元素的值Value。
2.根據(jù)權(quán)利要求1所述的一種面向申威眾核架構(gòu)的稀疏矩陣存儲(chǔ)方法,其特征在于:所述計(jì)算核心主要負(fù)責(zé)細(xì)粒度并行的計(jì)算任務(wù),計(jì)算核心可以直接離散訪問(wèn)主存,也可以通過(guò)DMA方式批量訪問(wèn)主存,眾核陣列內(nèi)可以通過(guò)寄存器通信方式進(jìn)行高效通信。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于無(wú)錫江南計(jì)算技術(shù)研究所,未經(jīng)無(wú)錫江南計(jì)算技術(shù)研究所許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910898286.2/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F3-00 用于將所要處理的數(shù)據(jù)轉(zhuǎn)變成為計(jì)算機(jī)能夠處理的形式的輸入裝置;用于將數(shù)據(jù)從處理機(jī)傳送到輸出設(shè)備的輸出裝置,例如,接口裝置
G06F3-01 .用于用戶和計(jì)算機(jī)之間交互的輸入裝置或輸入和輸出組合裝置
G06F3-05 .在規(guī)定的時(shí)間間隔上,利用模擬量取樣的數(shù)字輸入
G06F3-06 .來(lái)自記錄載體的數(shù)字輸入,或者到記錄載體上去的數(shù)字輸出
G06F3-09 .到打字機(jī)上去的數(shù)字輸出
G06F3-12 .到打印裝置上去的數(shù)字輸出
- 一種基于申威26010處理器的稀疏矩陣向量乘異構(gòu)眾核實(shí)現(xiàn)方法
- 申威26010眾核CPU上GEMM稠密矩陣乘高性能實(shí)現(xiàn)方法
- 一種適應(yīng)于“神威·太湖之光”上HPCG優(yōu)化的數(shù)據(jù)結(jié)構(gòu)及其高效實(shí)現(xiàn)方法
- 國(guó)產(chǎn)申威26010眾核處理器上多維FFT的高性能實(shí)現(xiàn)方法
- 一種基于申威眾核處理器的核組內(nèi)多程序多數(shù)據(jù)流分區(qū)并行的運(yùn)行方法
- 一種基于申威眾核處理器的大數(shù)據(jù)張量典范分解計(jì)算方法
- 基于異構(gòu)眾核處理器的格點(diǎn)量子色動(dòng)力學(xué)并行加速方法
- 面向申威眾核架構(gòu)的稀疏矩陣存儲(chǔ)方法
- 一種針對(duì)眾核處理器的從核軟件緩存共享方法
- 一種基于數(shù)據(jù)劃分和任務(wù)分配的稀疏張量典范分解方法





