[發(fā)明專利]一種基于龍芯3B的FFTW3優(yōu)化方法有效
| 申請?zhí)枺?/td> | 201410153672.6 | 申請日: | 2014-04-16 |
| 公開(公告)號: | CN103902506B | 公開(公告)日: | 2017-02-15 |
| 發(fā)明(設(shè)計)人: | 顧乃杰;王小樂;張明;任開新 | 申請(專利權(quán))人: | 中國科學(xué)技術(shù)大學(xué)先進技術(shù)研究院 |
| 主分類號: | G06F17/14 | 分類號: | G06F17/14 |
| 代理公司: | 安徽省合肥新安專利代理有限責任公司34101 | 代理人: | 何梅生 |
| 地址: | 230088 安徽*** | 國省代碼: | 安徽;34 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 fftw3 優(yōu)化 方法 | ||
1.一種基于龍芯3B的FFTW3優(yōu)化方法,其特征在于:所述優(yōu)化方法是利用向量指令方法、Cooley-Tukey算法以及實部和虛部單獨計算處理方法,分別按如下情況對離散傅里葉變換函數(shù)進行優(yōu)化;
情況一:在計算規(guī)模為和數(shù)的復(fù)數(shù)離散傅里葉變換中利用所述向量指令方法和Cooley-Tukey算法進行優(yōu)化;
情況二:在計算實數(shù)離散傅里葉變換中利用所述向量指令方法和實部和虛部單獨計算處理方法進行優(yōu)化;
所述向量指令方法是指使用所定義的128位訪存指令和計算指令對所述離散傅里葉變換函數(shù)中的輸入?yún)?shù)分別進行訪存和2點FFT計算:
所述128位訪存指令定義為:
讀取指令VLDC1vd,addr,用于讀取尋址地址寄存器addr中的128位數(shù)據(jù)到向量寄存器vd中;
存放指令VLSC1vd,addr,用于將寄存器vd中低128位數(shù)據(jù)存放到地址寄存器addr中;
所述計算指令定義為:
低128位2點FFT計算指令對VMULADD?vd,vs,vt,vr和VMULADDL?vd,vs,vt,vr,用于共同完成向量雙精度FFT運算低128位數(shù)據(jù)計算;
高128位2點FFT計算指令對VMULADDH?vd,vs,vt,vr和VMULADDLH?vd,vs,vt,vr,用于共同完成向量雙精度FFT運算高128位數(shù)據(jù)計算;
所述Cooley-Tukey算法是按如下步驟進行:
步驟1:利用式(1)和式(2)對所述離散傅里葉變換函數(shù)中計算規(guī)模N進行索引變換:
n=N2×n1+n2????式(1)
K=k1+N1×k2????式(2)
式(1)和式(2)中,N1和N2為所述計算規(guī)模N的因子,且滿足N1×N2=N;參數(shù)n的值域為[0,N-1],參數(shù)K的值域為[0,N-1],參數(shù)n1和參數(shù)k1的值域都為[0,N1-1],參數(shù)n2和參數(shù)k2的值域都為[0,N2-1];
步驟2:利用式(3)進行離散傅里葉變換獲得離散傅里葉變換的輸出值X(k1+N1k2):
式(3)中,為所述計算規(guī)模N的第n2k1個旋轉(zhuǎn)因子;為所述因子N2的第n2k2個旋轉(zhuǎn)因子;為所述因子N1的第n1k1個旋轉(zhuǎn)因子;
由此,將所述計算規(guī)模為N的離散傅里葉變換優(yōu)化成規(guī)模為因子N1和因子N2的離散傅里葉變換;
所述實部和虛部單獨計算處理方法按如下步驟進行:
步驟a:判斷所述離散傅里葉變換中的計算規(guī)模N的奇偶性,若計算規(guī)模N為偶數(shù),則執(zhí)行步驟b后結(jié)束;若計算規(guī)模N為奇數(shù),則跳轉(zhuǎn)到步驟c,執(zhí)行步驟c后結(jié)束;
步驟b:利用式(4)、式(5)和式(6)獲得所述離散傅里葉變換在偶數(shù)點時輸出序列的實部Xreal(k):
利用式(7)獲得所述離散傅里葉變換在偶數(shù)點時輸出序列的虛部Ximage(k):
式(4)、式(5)、式(6)和式(7)中,x(0),x(1),…x(n)為離散傅里葉變換序列;Xreal(0)為所述輸出序列第1個位置的實部值,Xreal(k)表示所述輸出序列第k個位置的實部值,參數(shù)k的值域為為所述輸出序列第個位置的實部值;Ximage(k)為所述輸出序列第個k位置的虛部值,參數(shù)i的值域為表示計算規(guī)模N的第ik個旋轉(zhuǎn)因子;
步驟c:利用式(8)和式(9)獲得所述離散傅里葉變換在奇數(shù)點時輸出序列的實部Xreal(k):
利用式(10)獲得所述離散傅里葉變換在奇數(shù)點時輸出序列的虛部Ximage(k):
式(8)、式(9)和式(10)中,Xreal(0)為所述輸出序列第1個位置的實部值,Xreal(k)為所述輸出序列第k個位置的實部值,參數(shù)k的值域為為所述輸出序列第個位置的實部值;Ximage(k)為所述輸出序列第個k位置的虛部值,參數(shù)i的值域為表示計算規(guī)模N的第ik個旋轉(zhuǎn)因子。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國科學(xué)技術(shù)大學(xué)先進技術(shù)研究院,未經(jīng)中國科學(xué)技術(shù)大學(xué)先進技術(shù)研究院許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410153672.6/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:橈動脈穿刺支撐墊
- 下一篇:一種無線數(shù)據(jù)移動查房車
- 一種基于集群處理機的SAS頻域信號處理的方法
- 一種基于龍芯3B的FFTW3優(yōu)化方法
- 一種基于核化相關(guān)濾波高速自動多目標跟蹤方法
- 聯(lián)產(chǎn)1;3;3;3-四氟丙烯與2;3;3;3-四氟丙烯的制備方法
- 一種星載大氣探測傅里葉變換光譜儀數(shù)據(jù)預(yù)處理方法
- 樂器演奏分析和評測方法
- 基于國產(chǎn)申威26010處理器的基2一維FFT的高性能實現(xiàn)方法
- 國產(chǎn)申威26010眾核處理器上多維FFT的高性能實現(xiàn)方法
- 一種Pi/8 D8PSK解調(diào)的載波頻偏估計方法
- 一種二元隨機序列檢測方法、系統(tǒng)、設(shè)備及計算機介質(zhì)





