[發(fā)明專利]具有高性能密碼操作的標(biāo)量單元在審
| 申請?zhí)枺?/td> | 202010099697.8 | 申請日: | 2020-02-18 |
| 公開(公告)號: | CN111290791A | 公開(公告)日: | 2020-06-16 |
| 發(fā)明(設(shè)計(jì))人: | 邵平平;駱培;李成 | 申請(專利權(quán))人: | 上海天數(shù)智芯半導(dǎo)體有限公司 |
| 主分類號: | G06F9/30 | 分類號: | G06F9/30 |
| 代理公司: | 南京鐘山專利代理有限公司 32252 | 代理人: | 劉佳慧 |
| 地址: | 201100 *** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 具有 性能 密碼 操作 標(biāo)量 單元 | ||
本發(fā)明的實(shí)施例通過對標(biāo)量單元進(jìn)行變化來提供技術(shù)解決方案,以使其能夠用于高性能密碼應(yīng)用程序。本發(fā)明的各方面提供了具有四個(gè)32位算術(shù)邏輯單元(ALU)的標(biāo)量單元。這四個(gè)ALU可以獨(dú)立地用作四個(gè)單獨(dú)的通道,每個(gè)通道生成32位結(jié)果。因此,每周期完成的指令數(shù)(IPC)可以是4個(gè)。此外,這四組32位ALU可被配置為兩個(gè)64位ALU,每兩個(gè)32位ALU為一組。在一個(gè)實(shí)施例中,該配置每個(gè)周期可以生成兩個(gè)64位結(jié)果。此外,當(dāng)ALU組合為一個(gè)單一單元時(shí),這四組32位ALU可被配置為一個(gè)128位ALU。本發(fā)明的各方面從一組四個(gè)32位標(biāo)量ALU產(chǎn)生數(shù)據(jù)寬度或格式不同于32位的輸出。
技術(shù)領(lǐng)域
本發(fā)明的實(shí)施例大體上涉及提供增強(qiáng)型標(biāo)量操作。
背景技術(shù)
諸如中央處理單元(CPU)或圖形處理單元(GPU)等的處理器中的向量處理執(zhí)行指令集,該指令集包含對被稱為向量的一維數(shù)據(jù)陣列進(jìn)行操作的指令。這與標(biāo)量處理器形成對比,其指令對單個(gè)數(shù)據(jù)項(xiàng)進(jìn)行操作。
向量指令通常在連續(xù)周期中對每個(gè)數(shù)據(jù)元素執(zhí)行操作。指令中的向量功能單元是管線型的。此外,每個(gè)管線級對一段數(shù)據(jù)操作,并且沒有向量依賴性(在內(nèi)部和向量之間)。
然而,存在缺點(diǎn),尤其是在向量操作不規(guī)則時(shí)。同時(shí),如果存儲器操作平衡未被監(jiān)測和維護(hù),并且數(shù)據(jù)未正確地或適當(dāng)?shù)赜成涞竭m當(dāng)?shù)拇鎯欤瑒t存儲器存取可能遇到瓶頸制約。
對于標(biāo)量處理,其通常被分類為SISD處理(單指令,單數(shù)據(jù))。此方法的另一變化是單指令、多線程(SIMT)處理。傳統(tǒng)的SIMT多線程處理器通過將線程組織成組并在單獨(dú)的處理管線、標(biāo)量或向量管線上執(zhí)行每個(gè)線程來提供多個(gè)線程的并行執(zhí)行。在單個(gè)周期中調(diào)度由一個(gè)組中的線程執(zhí)行的指令。生成處理管線控制信號,使得當(dāng)線程跨越處理管線的各級時(shí),組中的所有線程執(zhí)行一組類似的操作。例如,一組中的所有線程從寄存器文件讀取源操作數(shù),執(zhí)行處理單元中的指定算術(shù)運(yùn)算,并將結(jié)果寫回到寄存器文件。當(dāng)在處理器中支持多個(gè)語境時(shí),SIMT需要額外存儲器用于復(fù)制同一內(nèi)核中使用的恒定值。因而,當(dāng)從主存儲器或緩存加載不同恒定值時(shí),引入等待時(shí)間開銷。
由于向量處理在并行處理中的運(yùn)行優(yōu)勢,近年來密碼術(shù)已利用向量處理的優(yōu)點(diǎn)。然而,通常基于密碼算法和指令的密碼操作對于某些應(yīng)用程序可能太慢。例如,許多密碼算法需要大的存儲器和高計(jì)算性能。通用GPU(GPGPU)中的向量單元每個(gè)線程不具有大的存儲器。另一方面,在提及密碼操作與需求時(shí),相比向量單元,GPGPU裝置中的典型標(biāo)量單元具有相對較弱的性能。
發(fā)明內(nèi)容
本發(fā)明的實(shí)施例通過對標(biāo)量單元進(jìn)行小變化來提供技術(shù)解決方案,以使其能夠用于高性能密碼應(yīng)用程序。本發(fā)明的各方面提供了具有四個(gè)32位算術(shù)邏輯單元(ALU)的標(biāo)量單元(SU)。在一個(gè)實(shí)施例中,這四個(gè)ALU可以獨(dú)立地用作四個(gè)單獨(dú)的通道,每個(gè)通道生成32位結(jié)果。因此,每周期完成的指令數(shù)(IPC)可以是4個(gè)。此外,這四組32位ALU可被配置為兩個(gè)64位ALU,每兩個(gè)32位ALU為一組。在一個(gè)實(shí)施例中,該配置每個(gè)周期可以生成兩個(gè)64位結(jié)果。此外,當(dāng)ALU組合為一個(gè)單一單元時(shí),這四組32位ALU可被配置為一個(gè)128位ALU。本發(fā)明的各方面從一組四個(gè)32位標(biāo)量ALU產(chǎn)生數(shù)據(jù)寬度或格式不同于32位的輸出。
此外,本發(fā)明的各方面創(chuàng)建了以這樣的方式管理和利用標(biāo)量單元的新控制器。
附圖說明
本領(lǐng)域的普通技術(shù)人員可以了解,為了簡單和清晰起見,示出了附圖中的元件,因此為了避免混淆本發(fā)明的方面并未示出所有的連接和選項(xiàng)。例如,在商業(yè)上可行的實(shí)施例中有用或必需的常見但易于理解的元件通常不進(jìn)行描繪,以便有助于較少阻擋對本公開的這些各種實(shí)施例的觀察。將進(jìn)一步了解,可以以特定的發(fā)生次序描述或描繪某些動作和/或步驟,而所屬領(lǐng)域的技術(shù)人員將理解,實(shí)際上不需要關(guān)于序列的此類特異性。還應(yīng)當(dāng)理解,本文所用的術(shù)語和表達(dá)將關(guān)于其各自的相應(yīng)探究和研究領(lǐng)域進(jìn)行限定,除非本文中另外闡述了特定含義。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海天數(shù)智芯半導(dǎo)體有限公司,未經(jīng)上海天數(shù)智芯半導(dǎo)體有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010099697.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種微通道為波浪形的板式阻火器
- 下一篇:一種功率控制電路





