[發(fā)明專利]一種基于CUDA的S-BPF重建算法加速方法在審
| 申請(qǐng)?zhí)枺?/td> | 201610013575.6 | 申請(qǐng)日: | 2016-01-11 |
| 公開(公告)號(hào): | CN105678820A | 公開(公告)日: | 2016-06-15 |
| 發(fā)明(設(shè)計(jì))人: | 李磊;鄧林;王提;陳健;韓玉;孫艷敏;王敬雨 | 申請(qǐng)(專利權(quán))人: | 中國(guó)人民解放軍信息工程大學(xué) |
| 主分類號(hào): | G06T11/00 | 分類號(hào): | G06T11/00;G06T1/20 |
| 代理公司: | 鄭州大通專利商標(biāo)代理有限公司 41111 | 代理人: | 陳大通 |
| 地址: | 450052 河*** | 國(guó)省代碼: | 河南;41 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 cuda bpf 重建 算法 加速 方法 | ||
1.一種基于CUDA的S-BPF重建算法加速方法,其特征是含有如下步驟:
步驟1:從硬盤上讀取若干投影并在CPU中計(jì)算用于有限Hilbert逆變換的常數(shù)C;
步驟2:將若干投影從內(nèi)存?zhèn)魅腼@存并在GPU中實(shí)現(xiàn)求導(dǎo)-反投影,得到DBP圖像;
步驟3:對(duì)步驟2得到的DBP圖像進(jìn)行有限Hilbert逆變換并將結(jié)果從顯存?zhèn)骰貎?nèi)存。
2.根據(jù)權(quán)利要求1所述的基于CUDA的S-BPF重建算法加速方法,其特征在于:所述步驟2 中GPU執(zhí)行求導(dǎo)-反投影的特征包含以下步驟:
2.1、對(duì)投影數(shù)據(jù)進(jìn)行加權(quán)和求導(dǎo);
2.2、將結(jié)果從全局存儲(chǔ)器拷貝到紋理存儲(chǔ)器中;
2.3、執(zhí)行反投影操作。
3.根據(jù)權(quán)利要求1所述的基于CUDA的S-BPF重建算法加速方法,其特征在于:所述步驟3 中的有限Hilbert逆變換,需要將數(shù)據(jù)裝載到一個(gè)特定的數(shù)據(jù)類型cufftComplex中,具體執(zhí) 行流程為:
3.1、對(duì)PI線上的DBP數(shù)據(jù)加權(quán)并賦值到cufftComplex中;
3.2、使用CUFFT實(shí)現(xiàn)快速傅里葉變換;
3.3、在頻域進(jìn)行希爾伯特濾波;
3.4、使用CUFFT庫(kù)做逆傅里葉變換;
3.5、對(duì)其進(jìn)行加權(quán)并賦值DBP圖像;
3.6、將結(jié)果拷貝到CPU中。
4.根據(jù)權(quán)利要求1所述的基于CUDA的S-BPF重建算法加速方法,其特征在于:所述步驟1 的通過使用兩倍投影大小的內(nèi)存空間解除讀取投影操作和計(jì)算常數(shù)C操作之間的耦合,再 利用多線程技術(shù)實(shí)現(xiàn)兩者的并行執(zhí)行。
5.根據(jù)權(quán)利要求1所述的基于CUDA的S-BPF重建算法加速方法,其特征在于:所述步驟2 通過使用步驟1中兩倍投影大小的顯存空間解除內(nèi)存-顯存的投影數(shù)據(jù)傳輸和GPU中求導(dǎo)- 反投影操作之間的耦合,再利用CUDA中的異步技術(shù)實(shí)現(xiàn)兩者的并行執(zhí)行。
6.根據(jù)權(quán)利要求2所述的基于CUDA的S-BPF重建算法加速方法,其特征在于:所述GPU執(zhí) 行求導(dǎo)-反投影方法通過使用兩倍于步驟1中投影大小的顯存空間來(lái)解除步驟2.1、步驟 2.2、步驟2.3中的耦合,再利用CUDA中的多流技術(shù)和異步技術(shù)實(shí)現(xiàn)GPU中數(shù)據(jù)傳輸和計(jì)算的 并行執(zhí)行。
7.根據(jù)權(quán)利要求1所述的基于CUDA的S-BPF重建算法加速方法,其特征在于:所述GPU執(zhí) 行求導(dǎo)-反投影方法中,為了完全隱藏步驟2中數(shù)據(jù)傳輸時(shí)延,如CPU-GPU數(shù)據(jù)傳輸時(shí)延和 GPU-GPU數(shù)據(jù)傳輸時(shí)延,根據(jù)GPU的性能和圖像重建的規(guī)模對(duì)反投影進(jìn)行了分塊處理。
8.根據(jù)權(quán)利要求1所述的基于CUDA的S-BPF重建算法加速方法,其特征在于:所述步驟3 中的有限Hilbert逆變換方法中,為節(jié)約顯存,在一定圖像重建規(guī)模下,根據(jù)GPU計(jì)算和數(shù)據(jù) 傳輸性能,對(duì)有限Hilbert逆變換進(jìn)行分塊處理,實(shí)現(xiàn)了完全隱藏?cái)?shù)據(jù)傳輸時(shí)延。
9.根據(jù)權(quán)利要求1所述的基于CUDA的S-BPF重建算法加速方法,其特征在于:所述步驟3 中的有限Hilbert逆變換方法中,利用兩倍分塊大小的顯存空間保證兩組有限Hilbert逆變 換-回傳操作的獨(dú)立性,再利用CUDA中的多流技術(shù)和異步技術(shù)實(shí)現(xiàn)一組有限Hilbert逆變換 與另一組的結(jié)果回傳操作的并行執(zhí)行。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國(guó)人民解放軍信息工程大學(xué),未經(jīng)中國(guó)人民解放軍信息工程大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610013575.6/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 一種CUDA環(huán)形網(wǎng)絡(luò)與H265協(xié)議互連的方法
- 一種提高計(jì)算機(jī)并行計(jì)算編程自動(dòng)化程度的方法
- 一種基于CUDA實(shí)現(xiàn)聚類的方法及裝置
- CUDA高性能SAR信號(hào)處理裝置
- 無(wú)線數(shù)據(jù)分析方法、裝置及CUDA實(shí)體
- 基于Docker原生CentOS的CUDA的安裝方法、裝置及設(shè)備
- 一種面向GPU計(jì)算性能問題的溯源方法
- 一種高性能的帶權(quán)標(biāo)準(zhǔn)差背景建模方法
- 一種編程語(yǔ)言的轉(zhuǎn)換方法及系統(tǒng)
- CUDA程序移植方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)





