[發明專利]全精度及部分精度數值的計算方法及裝置有效
| 申請號: | 201710499092.6 | 申請日: | 2017-06-27 |
| 公開(公告)號: | CN107315710B | 公開(公告)日: | 2020-09-11 |
| 發明(設計)人: | 張淮聲;梁達成;陳博明;卞仁玉 | 申請(專利權)人: | 上海兆芯集成電路有限公司 |
| 主分類號: | G06F15/80 | 分類號: | G06F15/80;G06T1/20 |
| 代理公司: | 北京市柳沈律師事務所 11105 | 代理人: | 王新宇 |
| 地址: | 201203 上海市張*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 精度 部分 數值 計算方法 裝置 | ||
1.一種全精度及部分精度數值的計算方法,由一指令解碼單元執行,包含:
解碼從一編譯器傳來的一指令請求;以及
依據上述指令請求中的一指令模式執行m次循環以產生m個計算一第一類型數據的微指令或執行n次循環以產生n個計算一第二類型數據的微指令,使得多個算術邏輯組完成一個線程的多個通道計算,
其中,m小于n,并且上述第一類型數據的精度低于上述第二類型數據的精度;
其中,每一上述算術邏輯組包含:
一第一類運算通道;以及
多個第二類運算通道,
其中,當上述指令模式為一第一模式時,上述第一類運算通道及上述第二類運算通道中的每一者獨立完成一組第一類型數據的計算;以及,當上述指令模式為一第二模式時,上述第二類運算通道的每一者計算一組第二類型數據的一部份以產生部分結果,并且上述第一類運算通道合并上述第二類運算通道輸出的上述部分結果并使用上述合并結果完成上述組第二類型數據的計算。
2.如權利要求1所述的全精度及部分精度數值的計算方法,其中,上述指令模式記 錄于上述指令請求的最高比特。
3.如權利要求1所述的全精度及部分精度數值的計算方法,其中,上述第一類型數據為使用24比特表示的一部分精度數據,上述第二類型數據為使用32比特表示的一全精度數據,m為2,以及n為8。
4.如權利要求1所述的全精度及部分精度數值的計算方法,其中,每一上述算術邏輯組包含:組控制器,依據一微指令類型指示上述第一類運算通道及上述第二類運算通道中的每一者運行于上述第一模式或上述第二模式。
5.如權利要求1所述的全精度及部分精度數值的計算方法,其中,上述第一類運算通道及上述第二類運算通道中的每一者,運行于上述第一模式時,獨立完成一計算:
dest=Src0xSrc 1+Src2,
Src0、Src1及Scr2 代表三個來源存儲裝置中的上述第一類型數據,以及dest代表即將儲存于一目的地存儲裝置的上述第一類型數據,或即將輸出至一后處理單元的上述第一類型數據。
6.如權利要求1所述的全精度及部分精度數值的計算方法,其中,運行于上述第二模式時,上述第一類運算通道及上述第二類運算通道合作完成一計算:
dest=Src0xSrc 1+Src2,
Src0、Src1及Scr2 代表三個來源存儲裝置中的上述第二類型數據,及dest代表即將儲存于一目的地存儲裝置的上述第二類型數據,或即將輸出至一后處理單元的上述第二類型數據。
7.如權利要求6所述的全精度及部分精度數值的計算方法,其中,Src0、Src1及Scr2 中的每一者為包含一24比特尾數的一浮點數,以及上述第二類運算通道包含一第一運算單元、一第二運算單元及一第三運算單元,
其中,上述第一運算單元將Src0的尾數的高8比特乘以Src1的尾數的低16比特以產生一第一結果,上述第二運算單元將Src0的尾數的低16比特乘以Src1的尾數的高8比特以產生一第二結果,上述第三運算單元將Src0的尾數的高8比特乘以Src1的尾數的高8比特以產生一第三結果,上述第一類運算通道計算Src0的尾數的低16比特乘以Src1的尾數的低16比特以產生一第四結果,
其中,上述第一類運算通道將上述第三結果左移16比特,將上述第四結果右移16比特,加總上述第一結果、上述第二結果、位移后第三結果及位移后第四結果以產生Src0xSrc1的一尾數,
其中,上述第一類運算通道計算Src0xSrc1的一指數,將Src0xSrc1的上述尾數加上Src2的一尾數以產生dest的一尾數,將Src0xSrc1的上述指數及Src2的一指數中的較大者選擇為dest的一指數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海兆芯集成電路有限公司,未經上海兆芯集成電路有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710499092.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:RJ45型雙網四串口服務器
- 下一篇:一種自適應的外生變量識別方法





