日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]一種基于INTEL AVX指令集的浮點峰值計算吞吐測試方法有效

專利信息
申請號: 201810014687.2 申請日: 2018-01-08
公開(公告)號: CN108268349B 公開(公告)日: 2021-05-18
發明(設計)人: 李艷兵;路凱林;蔣鐘文 申請(專利權)人: 青島雷神科技股份有限公司
主分類號: G06F11/22 分類號: G06F11/22;G06F9/30;G06F9/38
代理公司: 青島致嘉知識產權代理事務所(普通合伙) 37236 代理人: 單虎
地址: 266000 山東省青島市嶗山*** 國省代碼: 山東;37
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 一種 基于 intel avx 指令 浮點 峰值 計算 吞吐 測試 方法
【說明書】:

發明公開了一種基于INTEL AVX指令集的浮點峰值計算吞吐測試算法,包括以下步驟:步驟1:AVX 128Bit ADD/Sub;步驟2:AVX 128bit Mul;步驟3:AVX 128Bit FMA;步驟4:AVX 128Bit ADD+Mul;步驟5:AVX 256Bit ADD/Sub;步驟6,AVX 256Bit Mul;步驟7,AVX 256Bit FMA;步驟8,AVX 256Bit ADD+Mul;步驟9,AVX 512Bit ADD/Sub;步驟10,AVX 512Bit Mul;步驟11,AVX 512Bit ADD+Mul;步驟12,AVX 512Bit FMA;步驟13,計算過程自動迭代和納秒級計時;步驟14,針對不同處理器架構;步驟15,單線程測試+多線程調用;步驟16,顯示出測試結果。本發明在盡可能短的測試時間下,可針對目前主流X86處理器的向量計算能力做出評估,幫助研究人員快速確定該架構處理器在SIMD吞吐中的設計,找到其基本計算能力的側重點和性能峰值點。

技術領域

本發明涉及浮點算法領域,具體為一種基于INTEL AVX指令集的浮點峰值計算吞吐測試方法。

背景技術

過去,主流CPU通過提高每秒指令執行次數來提高CPU在單位時間內的計算能力,通常每個時鐘周期執行一條指令完成一次計算,但隨著計算的復雜度增加,CPU內部引入了流水線執行的方式,即將一個完整的指令執行步驟拆分成多個步驟,由各個寄存器按流水線的形式分別完成,每個時鐘周期同樣完成一次操作,只要流水線能穩定運行下去,依舊可以做到近似一個時鐘周期有一條指令完成,這種一個時鐘周期完成一條指令的形式,也被稱為標量處理器。

但隨著CPU每秒時鐘周期數不斷提高,也就是CPU主頻不斷提高,要想繼續提升主頻就相當困難了,于是在CPU內加入多個指令執行流水線,做到同時有多個流水線在幾乎同時進行指令執行的流水工作,在受到緩存缺失,分支預測失敗等情況的影響下,依舊能實現每個時鐘周期平均執行超過一條指令的微處理器,也被稱為超標量流水線架構。

標量或是超標量處理器,都沒有解決一個問題,那就是仍然是一條計算指令實現一次數值計算,但隨著單純增加執行單元對功耗發熱的影響越來越大,CPU的計算性能發展為多線程并發與SIMD并行兩種思路,多線程仍然沒有改變指令層面的執行,仍舊是提高單位時間內指令執行的數量,而SIMD則改變了過去指令執行的基本思想,引入了向量(矢量)計算的概念。

過去無論計算8位/16位/32位抑或其他數據類型的計算,一次指令執行往往就是一組數值的計算,如1+1,2X2,1.00001X1.000001等,而SIMD指令集則提供了一條指令同時執行多組數值計算的可能,如定義數據類型為32位浮點(單精度浮點)。

而有4組數值計算,如A+B,C+D,E+F,G+H,分別將A,C,E,G裝入一個128bit SIMD寄存器,B,D,F,H裝入另一個128bit SIMD寄存器,然后這兩個寄存器相加的指令操作就完成了4次32位浮點計算,也就大大提高了計算效率,如圖1所示。

隨著CPU的發展,如今向量指令集的位寬也在不斷增大,支持的直接指令操作也在不斷增加,不同數據類型之間的數據對齊支持,浮點數與整數數據的轉換都越來越方便,X86CPU上從MMX到SSE再到AVX,如今AVX512指令集可支持512bit寄存器,同時打包8個64位(雙精度浮點)浮點數和16個32位(單精度浮點數),同時為應對一些混合計算如乘法加法并存的計算,引入了FMA(Fused multiply Add)融合乘加指令,如FMA3指令可實現三操作數的融合乘加指令,即完成單指令A=(A+B)*C的計算(A,B,C三個操作數),抑或四操作數的FMA4指令,即A=(B+C)*D的計算(A,B,C,D為四個操作數)。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于青島雷神科技股份有限公司,未經青島雷神科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201810014687.2/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 国产欧美精品一区二区三区小说 | 三上悠亚亚洲精品一区二区 | 免费在线观看国产精品| 国产高清一区在线观看| 国产午夜精品一区二区三区欧美 | 日本精品一二三区| 午夜天堂在线| 亚洲欧洲日韩在线| 亚洲精品20p| 国产偷国产偷亚洲清高| 亚洲国产偷| 精品免费久久久久久久苍| 精品一区中文字幕| 国产日韩欧美亚洲| 国产三级精品在线观看| 日韩欧美国产高清91| 免费的午夜毛片| 欧美一区二区三区久久精品视| 国产精品刺激对白麻豆99| 国产精品国产三级国产播12软件| 色乱码一区二区三在线看| 午夜爽爽爽男女免费观看| 国产97久久| 性生交大片免费看潘金莲| 国产大片一区二区三区| 99久久精品免费看国产免费粉嫩 | 色婷婷综合久久久中文一区二区| 色狠狠色狠狠综合| 久久精品爱爱视频| 午夜精品一区二区三区三上悠亚 | 日本护士hd高潮护士| 大bbw大bbw巨大bbw看看| 国产品久精国精产拍| 久久人人97超碰婷婷开心情五月| 久久国产精品欧美| 91社区国产高清| 日本美女视频一区二区| 国产精品一品二区三区四区五区| 91看片app| 国产伦精品一区二区三区免费观看| 四虎久久精品国产亚洲av| 欧美三区二区一区| 免费午夜在线视频| 日韩中文字幕在线一区| 久久99中文字幕| 97久久超碰国产精品| 亚洲三区二区一区| 国产呻吟久久久久久久92 | 8x8x国产一区二区三区精品推荐 | 亚洲精品乱码久久久久久麻豆不卡| 久久国产精品久久| 国产视频一区二区视频| xxxx国产一二三区xxxx| 久久国产精久久精产国| 国产午夜亚洲精品羞羞网站| 99国产精品丝袜久久久久久| 性夜影院在线观看| 亚洲欧美国产中文字幕| 久久99精品久久久久国产越南| 欧洲国产一区| 国产精品自产拍在线观看桃花| 国产日韩欧美综合在线| 中文字幕一区二区三区免费| 午夜电影一区二区| 性视频一区二区三区| 国产精品视频免费一区二区| 91精品美女| 欧美日韩综合一区 | 国产精品久久久久久久妇女| 欧美一区二区三区激情视频| 97精品国产97久久久久久| 欧美日本三级少妇三级久久| 日本一区二区在线观看视频| 欧美日韩一卡二卡| 免费观看又色又爽又刺激的视频| 国产精品二区一区| 天干天干天干夜夜爽av| 国产高清精品一区| 夜夜躁狠狠躁日日躁2024| www.午夜av| 91精品免费观看| 欧美在线观看视频一区二区|