[發明專利]面向向量處理器的SAD向量化實現方法有效
| 申請號: | 201110213343.2 | 申請日: | 2011-07-28 |
| 公開(公告)號: | CN102231202A | 公開(公告)日: | 2011-11-02 |
| 發明(設計)人: | 劉仲;陳書明;劉衡竹;陳躍躍;陳海燕;龔國輝;孫永節;萬江華;吳家鑄;陳勝剛 | 申請(專利權)人: | 中國人民解放軍國防科學技術大學 |
| 主分類號: | G06T1/20 | 分類號: | G06T1/20 |
| 代理公司: | 湖南兆弘專利事務所 43008 | 代理人: | 周長清 |
| 地址: | 410073 湖南省長沙市開福區硯瓦池正街47號*** | 國省代碼: | 湖南;43 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 面向 向量 處理器 sad 量化 實現 方法 | ||
技術領域
本發明涉及向量處理器以及圖像處理領域,尤其涉及一種SAD向量化的實現方法。
背景技術
圖像處理領域中圖像匹配處理應用需許多高密度計算應用,如基于模板的圖像匹配往往需要計算差的絕對值和(Sum?of?Absolute?Difference,SAD)等,這類高密集運算任務需要將模板圖與實時圖中的每一個按像素遍歷的子圖逐個進行匹配計算,計算量非常大,單芯片難以滿足應用需求,基于多核處理器尤其是其中的向量處理器能夠大幅度提高圖像匹配的速度。向量處理器一般由多個處理單元(PE)組成,通常支持基于向量的數據加載和存儲。每個PE包含獨立的多個功能部件,一般包括移位部件、ALU部件、乘法部件等。向量處理器通常支持SIMD(單指令/多數據)操作,即在同一條向量指令的控制下,所有PE同時對各自的局部寄存器進行相同操作,用以開發應用程序的數據級并行性。
基于模板的圖像匹配中需要計算差的絕對值和,一般設實時圖A,其大小為MxN,模板圖為B,其大小為mxn,(M>m,N>n)。實時圖中以(u,v)為左上角點的與模板圖同大小的子圖為Auv,子圖Auv與模板圖B的差的絕對值和SAD系數值可用下式表示:
其中(Auv)ij表示子圖Auv中坐標(i,j)處的像素值,Bij表示模板圖B中坐標(i,j)處的像素值。
上面計算得到的SAD系數值ρ(u,v)用于表示子圖Auv與模板圖B的相似度。為了計算最佳匹配位置,需要遍歷實時圖中的所有子圖,并逐一計算子圖與模板圖的SAD系數值,求取SAD系數值的最小值。共需要計算(M?m)*(N?n)次SAD系數值,并且每次SAD系數值的計算涉及m*n個元素數據的求差、求絕對值以及絕對值累加,計算量非常大,單核處理器難以滿足性能需求,通常基于多核處理器或多個單核芯片采用并行的方法來提高處理速度。由于圖像數據通常采用8位像素值,遍歷實時圖需要按像素偏移讀取圖像數據,而一般的處理器不支持跨字邊界讀取數據,一般采用打包/解包方法來解決子圖的遍歷。
發明內容
本發明所要解決的技術問題是:針對現有技術存在的問題,本發明提供一種原理簡單、操作方便、能夠高效計算、能充分挖掘向量處理器的多級并行性以發揮向量處理器的并行計算性能、縮短運算時間的面向向量處理器的SAD向量化實現方法。
為解決上述技術問題,本發明采用以下技術方案:
一種面向向量處理器的SAD向量化實現方法,包括以下步驟:
(1)設實時圖A,其大小為MxN,模板圖為B,其大小為mxn,且M>m,N>n;向量處理器包括P個處理單元;
(2)向量處理器遍歷實時圖A并存取實時圖A中的兩個頭部間隔4個元素且向量長度為4*p的子圖Auv和A(u+4)v,通過混洗操作得到4個頭部間隔1個元素且長度為4*p的相鄰子圖A(u+k)v(k=0,1,2,3);
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國人民解放軍國防科學技術大學,未經中國人民解放軍國防科學技術大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110213343.2/2.html,轉載請聲明來源鉆瓜專利網。





