[發明專利]一種加速雙線性插值計算的方法有效
| 申請號: | 201610479164.6 | 申請日: | 2016-06-22 |
| 公開(公告)號: | CN107527320B | 公開(公告)日: | 2020-06-02 |
| 發明(設計)人: | 朱旭光;劉宇 | 申請(專利權)人: | 南京視察者圖像識別科技有限公司 |
| 主分類號: | G06T3/40 | 分類號: | G06T3/40 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 210001 江蘇省南京市秦淮區永智路6*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 加速 雙線 性插值 計算 方法 | ||
雙線性插值算法在處理圖像縮放時應用十分廣泛,但是由于該算法中涉及浮點運算和大量乘法運算,隨著圖像尺寸增大,運算量隨之增加,實時性要求很難滿足,同時也會導致最終實現的芯片功耗高、處理速度慢。給雙線性插值算法初步加速可以考慮去浮點,但本發明使用SSE加速辦法比去浮點加速法更快。X86架構平臺的SSE擁有可以同時處理128位數據的能力,實驗結果表明,和原有算法比較,本發明使用的SSE指令加速方法可至少加速一倍以上。
技術領域
本發明涉及一種在圖像處理領域的雙線性插值算法的加速辦法。
背景技術
圖像縮放是圖像處理領域的基本操作之一,圖像縮放的算法很多,常見的有最近鄰法、基于邊緣的圖像算法、雙線性插值算法。最近鄰算法最為簡單,但是對圖像縮放效果極為不佳;基于邊緣的圖像算法雖效果較好,但是算法復雜度高,實現困難;雙線性插值算法在效果和算法復雜度之間能做到折中,故應用最多。
雙線性插值算法原理是利用源圖中虛擬點四周的四個真實存在的像素值來共同決定目標圖中的一個像素值,從而更真實地反映了原始圖像的信息。但雙線性插值算法中采用了大量的乘法運算,而且還涉及到浮點運算,當圖像尺寸增大,運算量也會相應增加,而計算機視覺的應用場景一般情況下對實時性會有一定要求,所以加速算法是研究的重點。
發明內容
本發明的目的是提出一種加速雙線性插值計算的方法,該方法的速度相比普通方法至少提速一倍以上。
本發明要解決的技術問題是,在效果不變的情況下,加速雙線性插值算法。
為解決上述技術問題,本發明采取以下技術方案:SSE指令集是X86平臺上一種SIMD(Single Instruction,Multiple Data,單指令、多數據)指令集,本發明通過使用一條SSE指令處理多個數據的方式,達到提高數據處理效率的目的。該方法的主要步驟包括:
(1)_mm_loadl_epi64指令導入加載兩對像素P12和P34,P12為像素P1和P2,P34為像素P3和P4;
(2)計算周邊四個像素的權重W1,W2,W3,W4,_mm_mul_ps指令將權重W乘以256,_mm_cvtps_epi32指令將W轉化成整數,_mm_packs_epi32指令將32位數據擴展轉化成16位數據,W={W1,W2,W3,W4};
(3)由_mm_unpacklo_epi8、_mm_unpackhi_epi64指令具體重組數據類型,將[RGBARGBARGBAGRBA]轉成[RRRRGGGGBBBBAAAA]數據,即AoS類型轉成SoA類型;
(4)_mm_unpacklo_epi8指令獲取低位數據并轉成16位,得到數據pRG,_mm_unpackhi_epi8指令獲取高位數據并轉成16位,得到數據pBA;
(5)_mm_madd_epi16指令將權重W分別和pRG、pBA進行運算得到outRG、outBA;
(6)_mm_hadd_epi32指令將outRG、outBA水平相加;
(7)_mm_packus_epi32、_mm_packus_epi16、_mm_cvtsi128_si32指令將最終數據轉成一個32位整數,該32位整數即為目標像素RGBA值,計算完成;
所述計算周邊四個像素的權重為:通過SSE指令計算周邊四個像素的權重,具體如下
(21)_mm_set_ss指令加載浮點坐標(x,y),_mm_unpacklo_ps指令交叉打包x和y;
(22)_m_floor_ps指令計算x和y的整數部分ix和iy,_mm_sub_ps指令計算坐標小數部分fx和fy;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京視察者圖像識別科技有限公司,未經南京視察者圖像識別科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610479164.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:圖像收縮方法和裝置
- 下一篇:鏡頭畸變的標定方法及裝置





