[發明專利]快速無分支向量除法計算有效
| 申請號: | 200980163160.5 | 申請日: | 2009-12-25 |
| 公開(公告)號: | CN102713835B | 公開(公告)日: | 2016-11-30 |
| 發明(設計)人: | A.I.科列索夫;V.F.庫里亞金;M.V.古塞瓦 | 申請(專利權)人: | 英特爾公司 |
| 主分類號: | G06F7/487 | 分類號: | G06F7/487;G06F9/38 |
| 代理公司: | 中國專利代理(香港)有限公司 72001 | 代理人: | 姜冰;李浩 |
| 地址: | 美國加利*** | 國省代碼: | 美國;US |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 快速 分支 向量 除法 計算 | ||
技術領域
本公開一般涉及計算的領域。更具體地說,本發明的一實施例一般涉及用于快速無分支向量除法計算的技術。
背景技術
與其它簡單的算術運算相比,用于除法運算的硬件實現例如由于更大的等待時間而已經很慢。由于現代架構中各種并行性的存在(例如經SIMD(單指令多數據)并行性、超標量(superscalar)和失序運行),在向量情況中能夠實現一定加速。例如,通過進一步Newton-Raphson改善(refinement)迭代方法(例如在http://en.wikipedia.org/wiki/Newton%E2%80%93Raphson_method所討論的),倒數近似一般對于單精度(SP)情況工作良好,在一些實現中在硬件除法運算上提供高達兩倍的加速。然而,由于在當前SSE架構中缺少雙精度倒數運算,此方案在雙精度(DP)方面失去了大部分其益處。因此,可能需要執行附加的DP到SP和SP到DP轉換以及指數域操縱。此外,SP和DP的上述近似一般要求帶有無限(INF)或零值的分母的特殊處理,從而降低了并行性并降低了潛在的性能增益。
附圖說明
參照附圖來提供詳細的描述。圖中,引用標號最左的數字識別其中最先出現該引用標號的圖。不同的圖中使用相同的引用標號來指示類似或相同的項目。
圖1示出根據本發明的一實施例的方法的流程圖。
圖2A-2C示出可在一些實施例中使用的偽代碼段。
圖3示出根據一實施例的快速向量除法的框圖。
圖4和5示出可用于實現本文中討論的一些實施例的計算系統的實施例的框圖。
具體實施方式
在下面的描述中,為了提供各種實施例的詳盡理解而陳述了許多特定的細節。然而,實踐本發明的各種實施例可無需這些特定的細節。在其它情況中,公知的方法、過程、組件和電路未被詳細描述以免混淆本發明的具體實施例。此外,本發明的實施例的各種方面可使用各種部件來執行,例如集成半導體電路(“硬件”)、組織到一個或多個程序(“軟件”)中的計算機可讀指令或硬件與軟件的某一組合。為了本公開的目的,對“邏輯”的引用將表示硬件、軟件(包括例如控制處理器的操作的微代碼)或它們的某一組合。
說明書中對“一個實施例”或“一實施例”的引用表示連同該實施例所述的具體特征、結構或特性可被包括在至少一個實現中。說明書中各種位置中短語“在一個實施例中”的出現可全部或可不全部指相同的實施例。
此外,在說明和權利要求中,可使用術語“耦合”和“連接”及其衍生詞。在本發明的一些實施例中,“連接”可用于指兩個或更多要素處于與彼此的直接物理或電接觸中。“耦合”可指兩個或更多元素處于直接物理或電接觸中。然而,“耦合”也可指兩個或更多要素可不處于與彼此的直接接觸中,但仍可與彼此交互或合作。
本文中討論的一些實施例可為雙精度除法/求倒數(inversion)向量計算提供改進的性能,例如,不要求以前必需的分支或特殊動作。向量除法計算可在SIMD計算平臺上被執行。通常,SIMD是用于實現數據級并行性的技術。具體而言,根據單個指令,在SIMD向量處理器(例如分別為圖4和5的處理器402和502/504)的多個對應通道(lane)中可處理多個數據。
在一些實現中,為幾個求倒數執行僅一次除法運算。用以下述內容作為示例(由I.?I.?Zavarzin、V.?F.?Kuryakin、V.?V.?Lunev、D.?M.?Obuvalin、V.?G.?Ryzhih在“Optimizatsiya?Vychislenij?Vektornyh?Funktsyj”中提議,見VANT.?ser.?Matematicheskoe?modelirovanie?fizicheskih?protsessov.?1997.?Vol.?4(俄語雜志)):
,?
,?
,?
,?
其中?
使用由R和三個其它變元(argument)的三次附加的相乘,可計算每個變元的求倒數,這通常比涉及大的等待時間和大的吞吐量值的四次硬件除法更快。更具體地說,對于有N個值的一般情況,對于此技術(D、M—分別對于除法和乘數的吞吐量值)的下一最大可能性能增益估計可以是:
增益=
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于英特爾公司,未經英特爾公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200980163160.5/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:通過網絡傳輸顯示用多媒體內容的系統和方法
- 下一篇:具有多個蒸汽室的散熱件





