[發明專利]一種基于龍芯3B的FFTW3優化方法有效
| 申請號: | 201410153672.6 | 申請日: | 2014-04-16 |
| 公開(公告)號: | CN103902506B | 公開(公告)日: | 2017-02-15 |
| 發明(設計)人: | 顧乃杰;王小樂;張明;任開新 | 申請(專利權)人: | 中國科學技術大學先進技術研究院 |
| 主分類號: | G06F17/14 | 分類號: | G06F17/14 |
| 代理公司: | 安徽省合肥新安專利代理有限責任公司34101 | 代理人: | 何梅生 |
| 地址: | 230088 安徽*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 fftw3 優化 方法 | ||
技術領域
本發明屬于電數字數據處理技術領域,具體涉及龍芯3B處理器上FFTW3實現優化方法。
背景技術
龍芯3B是首款國產商用8核處理器,主頻達到1GHz,支持向量運算加速,峰值計算能力達到128GFLOPS,具有很高的性能功耗比。龍芯3B主要用于高性能計算機、高性能服務器、數字信號處理等領域。FFTW(the?Faster?Fourier?Transform?in?the?West)是一個快速計算離散傅里葉變換的標準C語言程序集,其由MIT的M.Frigo和S.Johnson開發,可計算一維或多維實數和復數數據以及任意規模的離散傅里葉變換(DFT,Discrete?Fourier?Transform)。FFTW3是在FFTW的基礎上進行二次開發而成的新版本,新增了對共享和分布式存儲系統的并行變換,可自動適應你的機器,緩存,存儲器大小,寄存器個數。FFTW3通常比目前其它開源的傅里葉變換程序運行效率高,其最新版本為fftw-3.3.3。FFTW3的高效實現是通過將規模大的離散傅里葉變換分解為多個小規模的離散傅里葉變換,其核心代碼也就是完成小規模離散傅里葉變換,這些代碼比較短,采用匯編語言實現將會獲得更好的性能,龍芯3B處理有132個向量寄存器,能夠保證其匯編實現對寄存器數量的需要。
目前實際應用的FFTW3并沒有針對龍芯3B處理器進行優化,因此通用的FFTW3單純移植在龍芯3B處理器上不能較好地發揮龍芯3B處理器的特性。
發明內容
本發明是為避免上述現有技術所存在的不足之處,提供基于龍芯3B的FFTW3優化方法,以期提高FFTW3在龍芯3B處理器上的運行性能,從而達到在龍芯3B處理器上FFTW3的高效實現。
本發明為解決以上技術問題采用如下方案:
本發明一種基于龍芯3B的FFTW3優化方法的特點是:所述優化方法是利用向量指令方法、Cooley-Tukey算法以及實部和虛部單獨計算處理方法,分別按如下情況對離散傅里葉變換函數進行優化;
情況一:在計算規模為和數的復數離散傅里葉變換中利用所述向量指令方法和Cooley-Tukey算法進行優化;
情況二:在計算實數離散傅里葉變換中利用所述向量指令方法和實部和虛部單獨計算處理方法進行優化;
所述向量指令方法是指使用所定義的128位訪存指令和計算指令對所述離散傅里葉變換函數中的輸入參數分別進行訪存和2點FFT計算:
所述128位訪存指令定義為:
讀取指令VLDC1vd,addr,用于讀取尋址地址寄存器addr中的128位數據到向量寄存器vd中;
存放指令VLSC1vd,addr,用于將寄存器vd中低128位數據存放到地址寄存器addr中;
所述計算指令定義為:
低128位2點FFT計算指令對VMULADD?vd,vs,vt,vr和VMULADDL?vd,vs,vt,vr,用于共同完成向量雙精度FFT運算低128位數據計算;
高128位2點FFT計算指令對VMULADDH?vd,vs,vt,vr和VMULADDLH?vd,vs,vt,vr,用于共同完成向量雙精度FFT運算高128位數據計算;
所述Cooley-Tukey算法是按如下步驟進行:
步驟1:利用式(1)和式(2)對所述離散傅里葉變換函數中計算規模N進行索引變換:
n=N2×n1+n2????式(1)
K=k1+N1×k2????式(2)
式(1)和式(2)中,N1和N2為所述計算規模N的因子,且滿足N1×N2=N;參數n的值域為[0,N-1],參數K的值域為[0,N-1],參數n1和參數k1的值域都為[0,N1-1],參數n2和參數k2的值域都為[0,N2-1];
步驟2:利用式(3)進行離散傅里葉變換獲得離散傅里葉變換的輸出值X(k1+N1k2):
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學技術大學先進技術研究院,未經中國科學技術大學先進技術研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410153672.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:橈動脈穿刺支撐墊
- 下一篇:一種無線數據移動查房車





