[發明專利]用于加速延遲敏感算法的恒定標量寄存器架構在審
| 申請號: | 202010098892.9 | 申請日: | 2020-02-18 |
| 公開(公告)號: | CN111258650A | 公開(公告)日: | 2020-06-09 |
| 發明(設計)人: | 邵平平;駱培;李成 | 申請(專利權)人: | 上海天數智芯半導體有限公司 |
| 主分類號: | G06F9/30 | 分類號: | G06F9/30 |
| 代理公司: | 南京鐘山專利代理有限公司 32252 | 代理人: | 上官鳳棲 |
| 地址: | 201100 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 加速 延遲 敏感 算法 恒定 標量 寄存器 架構 | ||
1.一種圖形處理子系統,包括:
圖形處理單元(GPU),所述圖形處理單元可操作以:
識別與所述GPU相關聯的標量寄存器文件,所述標量寄存器文件具有標量寄存器分配總數;
識別標量處理所需的單元以用于內核執行;
分配所述標量寄存器文件中的標量寄存器以用于所述內核執行;
從所述標量寄存器分配總數識別所述標量寄存器文件中剩余的未使用單元;
分配所述標量寄存器文件中剩余的未使用單元的標量寄存器以存儲用于所述內核執行的恒定標量值;
在所述內核執行之前,初始化所述標量寄存器文件;以及
啟動所述內核執行。
2.根據權利要求1所述的圖形處理子系統,還包括在完成所述內核執行時,在下一內核執行之前,回收所述未使用單元。
3.根據權利要求1所述的圖形處理子系統,其中,分配所述標量寄存器文件中的標量寄存器以用于所述內核執行包括分配所述標量寄存器文件中的標量寄存器以用于所述內核執行的一個或多個線程。
4.一種由圖形處理單元處理的計算機實現的方法,所述方法包括:
識別與GPU相關聯的標量寄存器文件,所述標量寄存器文件具有標量寄存器分配總數;
識別標量處理所需的單元以用于內核執行;
分配所述標量寄存器文件中的標量寄存器以用于所述內核執行;
從所述標量寄存器分配總數識別所述標量寄存器文件中剩余的未使用單元;
分配所述標量寄存器文件中剩余的未使用單元的標量寄存器以存儲用于所述內核執行的恒定標量值;
在所述內核執行之前,初始化所述標量寄存器文件;以及
啟動所述內核執行。
5.根據權利要求4所述的計算機實現的方法,還包括在完成所述內核執行時,在下一內核執行之前,回收所述未使用單元。
6.根據權利要求4所述的計算機實現的方法,其中,分配所述標量寄存器文件中的標量寄存器以用于所述內核執行包括分配所述標量寄存器文件中的標量寄存器以用于所述內核執行的一個或多個線程。
7.一種用于重用未使用的標量寄存器的系統,所述系統包括:
存儲器,所述存儲器被配置成存儲由線程執行的指令;
圖形處理單元(GPU),所述圖形處理單元被配置成執行標量指令與向量指令,其中所述GPU被配置成:
通過線程控制器識別與所述GPU相關聯的標量寄存器文件,所述標量寄存器文件具有標量寄存器分配總數;
通過所述線程控制器識別標量處理所需的單元以用于內核執行;
通過所述線程控制器分配所述標量寄存器文件中的標量寄存器以用于所述內核執行;
通過所述線程控制器從所述標量寄存器分配總數識別所述標量寄存器文件中剩余的未使用單元;
通過所述線程控制器分配所述標量寄存器文件中剩余的未使用單元的標量寄存器以存儲用于所述內核執行的恒定標量值;
在所述內核執行之前,通過所述線程控制器初始化所述標量寄存器文件;以及
通過所述線程控制器啟動所述內核執行。
8.根據權利要求7所述的系統,還包括在完成所述內核執行時,在下一內核執行之前,回收所述未使用單元。
9.根據權利要求7所述的系統,其中,分配所述標量寄存器文件中的標量寄存器以用于所述內核執行包括分配所述標量寄存器文件中的標量寄存器以用于所述內核執行的一個或多個線程。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海天數智芯半導體有限公司,未經上海天數智芯半導體有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010098892.9/1.html,轉載請聲明來源鉆瓜專利網。





