[發(fā)明專利]面向向量處理器的SAD向量化實現(xiàn)方法有效
| 申請?zhí)枺?/td> | 201110213343.2 | 申請日: | 2011-07-28 |
| 公開(公告)號: | CN102231202A | 公開(公告)日: | 2011-11-02 |
| 發(fā)明(設(shè)計)人: | 劉仲;陳書明;劉衡竹;陳躍躍;陳海燕;龔國輝;孫永節(jié);萬江華;吳家鑄;陳勝剛 | 申請(專利權(quán))人: | 中國人民解放軍國防科學(xué)技術(shù)大學(xué) |
| 主分類號: | G06T1/20 | 分類號: | G06T1/20 |
| 代理公司: | 湖南兆弘專利事務(wù)所 43008 | 代理人: | 周長清 |
| 地址: | 410073 湖南省長沙市開福區(qū)硯瓦池正街47號*** | 國省代碼: | 湖南;43 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 面向 向量 處理器 sad 量化 實現(xiàn) 方法 | ||
1.一種面向向量處理器的SAD向量化實現(xiàn)方法,其特征在于包括以下步驟:
(1)設(shè)實時圖A,其大小為MxN,模板圖為B,其大小為mxn,且M>m,N>n;向量處理器包括P個處理單元;
(2)向量處理器遍歷實時圖A并存取實時圖A中的兩個頭部間隔4個元素且向量長度為4*p的子圖Auv和A(u+4)v,通過混洗操作得到4個頭部間隔1個元素且長度為4*p的相鄰子圖A(u+k)v(k=0,1,2,3);
(3)從模板圖B中取1個向量長度為4*p的子圖;該子圖坐標與子圖A(u+k)v(k=0,1,2,3)的坐標位置對應(yīng);
(4)分別計算出4個子圖A(u+k)v(k=0,1,2,3)與模板圖B的SAD系數(shù)值ρ(u,v),ρ(u,v+1),ρ(u,v+2),ρ(u,v+3);
(5)令u=u+4,重復(fù)上述步驟(2)到步驟(5)直至遍歷完實時圖A,可以計算得到實時圖A與模板圖B的所有SAD系數(shù)值。
2.根據(jù)權(quán)利要求1所述的面向向量處理器的SAD向量化實現(xiàn)方法,其特征在于,所述的步驟(4)中ρ(u,v)的計算公式為:
其中aiv=(Auv)iv,(Auv)i(v+1),(Auv)i(v+2),(Auv)i(v+3)為子圖Auv中4個8位像素值構(gòu)成的32位定點向量;biv=(Biv,Bi(v+1),Bi(v+2),Bi(v+3)為模板圖B中4個8位像素值構(gòu)成的32位定點向量,ev=(1,1,1,1)為4個單位像素值構(gòu)成的32位定點向量,為兩個向量的點積;L是循環(huán)計數(shù),L=mn/4p;
分別令u=u+k,(k=0,1,2,3),代入上式中,可分別計算得到ρ(u,v),ρ(u,v+1),ρ(u,v+2),ρ(u,v+3)。
3.根據(jù)權(quán)利要求2所述的面向向量處理器的SAD向量化實現(xiàn)方法,其特征在于,所述是計算aiv,biv兩個向量的差的絕對值的和,包括以下4個計算步驟:
①為基于SIMD的減法操作求aiv,biv兩個向量的差;
②為基于SIMD的求絕對值操作對步驟①的減法結(jié)果分別求絕對值;
③為基于SIMD的點積操作對步驟②的絕對值結(jié)果在處理單元內(nèi)求和;
④為基于向量處理器的定點歸約求和操作計算aiv,biv兩個向量的差的絕對值的和。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國人民解放軍國防科學(xué)技術(shù)大學(xué),未經(jīng)中國人民解放軍國防科學(xué)技術(shù)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110213343.2/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





