[發(fā)明專利]可變格式、可變稀疏矩陣乘法指令在審
| 申請(qǐng)?zhí)枺?/td> | 202010944726.6 | 申請(qǐng)日: | 2019-05-22 |
| 公開(kāi)(公告)號(hào): | CN112099852A | 公開(kāi)(公告)日: | 2020-12-18 |
| 發(fā)明(設(shè)計(jì))人: | 馬克·A·安德斯;希曼殊·考爾;薩努·馬修 | 申請(qǐng)(專利權(quán))人: | 英特爾公司 |
| 主分類號(hào): | G06F9/30 | 分類號(hào): | G06F9/30;G06F7/523;G06F17/16 |
| 代理公司: | 北京東方億思知識(shí)產(chǎn)權(quán)代理有限責(zé)任公司 11258 | 代理人: | 姜飛 |
| 地址: | 美國(guó)加利*** | 國(guó)省代碼: | 暫無(wú)信息 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 可變 格式 稀疏 矩陣 乘法 指令 | ||
公開(kāi)的實(shí)施例涉及可變格式、可變稀疏矩陣乘法指令。在一個(gè)示例中,處理器包括提取和解碼電路,用于提取和解碼可變格式、可變稀疏矩陣乘法(VFVSMM)指令,所述指令指定分別具有(M×K)、(K×N)和(M×N)個(gè)元素的A、B和C矩陣的位置;執(zhí)行電路,該執(zhí)行電路響應(yīng)于經(jīng)解碼的VFVSMM指令用于:將指定的A矩陣的每一行與后續(xù)行錯(cuò)開(kāi)路由到(M×N)處理陣列的相應(yīng)行中,并將指定的B矩陣的每一列與后續(xù)列錯(cuò)開(kāi)路由到處理陣列的相應(yīng)列中,其中,處理單元中的每一個(gè)生成A矩陣元素和具有與A矩陣元素的列地址相同的行地址的匹配B矩陣元素的K個(gè)乘積,并且將每個(gè)所生成的乘積與相應(yīng)的C矩陣元素累加。
本申請(qǐng)是申請(qǐng)日為2019年5月22日、申請(qǐng)?zhí)枮?01910431218.5、題為“可變格式、可變稀疏矩陣乘法指令”的發(fā)明專利申請(qǐng)的分案申請(qǐng)。
技術(shù)領(lǐng)域
本發(fā)明的領(lǐng)域總體上涉及計(jì)算機(jī)處理器架構(gòu),具體而言,涉及可變格式、可變稀疏矩陣乘法指令。
背景技術(shù)
諸如深度神經(jīng)網(wǎng)絡(luò)的機(jī)器學(xué)習(xí)架構(gòu)已經(jīng)應(yīng)用于包括計(jì)算機(jī)視覺(jué)、語(yǔ)音識(shí)別、自然語(yǔ)言處理、音頻識(shí)別、社交網(wǎng)絡(luò)過(guò)濾、機(jī)器翻譯、生物信息學(xué)和藥物設(shè)計(jì)的領(lǐng)域。深度學(xué)習(xí)是一類機(jī)器學(xué)習(xí)算法。最大化深度學(xué)習(xí)算法和計(jì)算的靈活性和成本效率可以幫助滿足深度學(xué)習(xí)處理器(例如,在數(shù)據(jù)中心中執(zhí)行深度學(xué)習(xí)的那些處理器)的需求。
矩陣乘法是包括機(jī)器學(xué)習(xí)的許多算法的關(guān)鍵性能/功率限制。一些傳統(tǒng)的矩陣乘法方法是專用的,例如它們?nèi)狈脤捓奂悠髦С指鞣N數(shù)據(jù)格式(有符號(hào)和無(wú)符號(hào)8b/16b整數(shù)、16b浮點(diǎn))的靈活性,以及支持密集和稀疏矩陣的靈活性。
發(fā)明內(nèi)容
根據(jù)本申請(qǐng)的一方面,提供了一種處理器,包括:用于存儲(chǔ)數(shù)據(jù)的緩存;被耦合到緩存的多個(gè)核,多個(gè)核中的核包括:執(zhí)行模塊,用于執(zhí)行至少一個(gè)指令,以根據(jù)所選擇的操作模式執(zhí)行針對(duì)第一源矩陣和第二源矩陣的乘法累加操作來(lái)生成結(jié)果矩陣,所選擇的操作模式包括第一操作模式和第二操作模式,在第一操作模式中,至少第一源矩陣是具有位于特定位置處的非零數(shù)據(jù)元素的稀疏矩陣,在第二操作模式中,第一源矩陣和第二源矩陣都是密集矩陣,其中,當(dāng)處于第一操作模式中時(shí),第一源矩陣將以壓縮格式被存儲(chǔ),壓縮格式標(biāo)識(shí)非零數(shù)據(jù)元素的位置,執(zhí)行模塊還包括:多個(gè)乘法累加模塊,用于將第一源矩陣的非零數(shù)據(jù)元素與第二源矩陣中基于壓縮格式中的位置標(biāo)識(shí)出的對(duì)應(yīng)數(shù)據(jù)元素相乘,以生成多個(gè)乘積,并將多個(gè)乘積與累加值相加來(lái)生成結(jié)果矩陣。
根據(jù)本申請(qǐng)的另一方面,提供了一種方法,包括:將數(shù)據(jù)存儲(chǔ)在緩存中;由被耦合到緩存的多個(gè)核中的核、根據(jù)所選擇的操作模式執(zhí)行針對(duì)第一源矩陣和第二源矩陣的乘法累加操作來(lái)生成結(jié)果矩陣,所選擇的操作模式包括第一操作模式和第二操作模式,在第一操作模式中,至少第一源矩陣是具有位于特定位置處的非零數(shù)據(jù)元素的稀疏矩陣,在第二操作模式中,第一源矩陣和第二源矩陣都是密集矩陣,其中,當(dāng)處于第一操作模式中時(shí),第一源矩陣將以壓縮格式被存儲(chǔ),壓縮格式標(biāo)識(shí)非零數(shù)據(jù)元素的位置,乘法累加操作還包括:將第一源矩陣的非零數(shù)據(jù)元素與第二源矩陣中基于壓縮格式中的位置標(biāo)識(shí)出的對(duì)應(yīng)數(shù)據(jù)元素相乘,以生成多個(gè)乘積,并且將多個(gè)乘積與累加值相加來(lái)生成結(jié)果矩陣。
根據(jù)本申請(qǐng)的又一方面,提供了一種存儲(chǔ)有程序代碼的機(jī)器可讀介質(zhì),程序代碼在被機(jī)器執(zhí)行時(shí)使得機(jī)器執(zhí)行上述方法。
附圖說(shuō)明
通過(guò)示例而非限制的方式在附圖的圖中示出了本發(fā)明,其中相似的附圖標(biāo)記表示類似的元素,并且其中:
圖1是示出根據(jù)實(shí)施例的用于執(zhí)行可變格式、可變稀疏矩陣乘法(VFVSMM)指令的處理部件的框圖;
圖2是根據(jù)一些實(shí)施例的用于執(zhí)行可變格式、可變稀疏矩陣乘法(VFVSMM)指令的處理陣列的框圖;
圖3是示出根據(jù)一些實(shí)施例的可變格式、可變稀疏矩陣乘法(VFVSMM)指令的部分執(zhí)行的流程框圖;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于英特爾公司,未經(jīng)英特爾公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010944726.6/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 在集成電路器件中求解線性矩陣
- 矩陣計(jì)算裝置、矩陣計(jì)算方法
- 一種數(shù)據(jù)聚類的方法、裝置及Spark大數(shù)據(jù)平臺(tái)
- 適用于黑白圖片的神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)方法以及訓(xùn)練方法
- 適用于灰度圖片的神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)方法以及訓(xùn)練方法
- 矩陣
- 矩陣/密鑰生成裝置、矩陣/密鑰生成系統(tǒng)、矩陣結(jié)合裝置、矩陣/密鑰生成方法、程序
- 矩陣運(yùn)算電路、矩陣運(yùn)算裝置及矩陣運(yùn)算方法
- 矩陣乘法計(jì)算方法和裝置
- 數(shù)據(jù)讀取方法、裝置、介質(zhì)和計(jì)算設(shè)備





