[發(fā)明專利]基于高維離散余弦變換的無參考光場(chǎng)圖像質(zhì)量評(píng)價(jià)方法有效
| 申請(qǐng)?zhí)枺?/td> | 202110244734.4 | 申請(qǐng)日: | 2021-03-05 |
| 公開(公告)號(hào): | CN112950592B | 公開(公告)日: | 2023-06-06 |
| 發(fā)明(設(shè)計(jì))人: | 郁梅;項(xiàng)建軍;蔣志迪;蔣剛毅 | 申請(qǐng)(專利權(quán))人: | 寧波大學(xué) |
| 主分類號(hào): | G06T7/00 | 分類號(hào): | G06T7/00;G06F16/245 |
| 代理公司: | 寧波奧圣專利代理有限公司 33226 | 代理人: | 周玨 |
| 地址: | 315211 浙*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 離散 余弦 變換 參考 圖像 質(zhì)量 評(píng)價(jià) 方法 | ||
1.一種基于高維離散余弦變換的無參考光場(chǎng)圖像質(zhì)量評(píng)價(jià)方法,其特征在于包括以下步驟:
步驟1:將待評(píng)價(jià)的4維的光場(chǎng)圖像記為L,L的角度分辨率為U×V,L的空間分辨率為X×Y;然后將L視作為2維的子孔徑圖像陣列,子孔徑圖像陣列由U×V幅子孔徑圖像構(gòu)成,每幅子孔徑圖像的分辨率為X×Y,將子孔徑圖像陣列中視點(diǎn)坐標(biāo)位置為(u,v)的子孔徑圖像記為Iu,v;其中,1≤u≤U,1≤v≤V;
步驟2:將子孔徑圖像陣列中除最后一行和最后一列外的每幅子孔徑圖像作為待處理子孔徑圖像,將子孔徑圖像陣列中視點(diǎn)坐標(biāo)位置為(u',v')的待處理子孔徑圖像記為Iu',v';然后計(jì)算子孔徑圖像陣列中的每幅待處理子孔徑圖像與其水平相鄰的子孔徑圖像之間的水平差分圖像,將Iu',v'與其水平相鄰的子孔徑圖像即子孔徑圖像陣列中視點(diǎn)坐標(biāo)位置為(u'+1,v')的待處理子孔徑圖像Iu'+1,v'之間的水平差分圖像記為將中坐標(biāo)位置為(x,y)的像素點(diǎn)的像素值記為并計(jì)算子孔徑圖像陣列中的每幅待處理子孔徑圖像與其垂直相鄰的子孔徑圖像之間的垂直差分圖像,將Iu',v'與其垂直相鄰的子孔徑圖像即子孔徑圖像陣列中視點(diǎn)坐標(biāo)位置為(u',v'+1)的待處理子孔徑圖像Iu',v'+1之間的垂直差分圖像記為將中坐標(biāo)位置為(x,y)的像素點(diǎn)的像素值記為接著計(jì)算子孔徑圖像陣列中的每幅待處理子孔徑圖像的子孔徑梯度圖像,將Iu',v'的子孔徑梯度圖像記為Gu',v',將Gu',v'中坐標(biāo)位置為(x,y)的像素點(diǎn)的像素值記為Gu',v'(x,y),在得到子孔徑圖像陣列中的所有待處理子孔徑圖像的子孔徑梯度圖像后,將子孔徑圖像陣列轉(zhuǎn)換成子孔徑梯度圖像陣列,記為G,G的角度分辨率為(U-1)×(V-1),即由(U-1)×(V-1)幅子孔徑梯度圖像構(gòu)成,G的空間分辨率為X×Y,即每幅子孔徑梯度圖像的分辨率為X×Y;其中,1≤u'≤U-1,1≤v'≤V-1,1≤x≤X,1≤y≤Y,符號(hào)“|?|”為取絕對(duì)值符號(hào),Iu',v'(x,y)表示Iu',v'中坐標(biāo)位置為(x,y)的像素點(diǎn)的像素值,Iu'+1,v'(x,y)表示Iu'+1,v'中坐標(biāo)位置為(x,y)的像素點(diǎn)的像素值,Iu',v'+1(x,y)表示Iu',v'+1中坐標(biāo)位置為(x,y)的像素點(diǎn)的像素值;
步驟3:將G劃分為個(gè)互不重疊的尺寸為4×4×4×4的4D塊,將G中的第s個(gè)4D塊記為GBs,將GBs中坐標(biāo)位置為(u1,v1,x1,y1)的像素點(diǎn)的像素值記為GBs(u1,v1,x1,y1);然后采用四維離散余弦變換技術(shù)將G中的每個(gè)4D塊轉(zhuǎn)換到4D-DCT域中,得到G中的每個(gè)4D塊對(duì)應(yīng)的頻域塊,將GBs對(duì)應(yīng)的頻域塊記為FBs,將FBs中頻域坐標(biāo)位置為上的值記為即為GBs在4D-DCT域中在頻域坐標(biāo)位置上的4D-DCT系數(shù),GBs在4D-DCT域中共包含有256個(gè)4D-DCT系數(shù),包括1個(gè)直流系數(shù)和255個(gè)交流系數(shù),當(dāng)時(shí)GBs在4D-DCT域中在頻域坐標(biāo)位置(1,1,1,1)上的4D-DCT系數(shù)為直流系數(shù);其中,符號(hào)為向下取整符號(hào),1≤u1≤4,1≤v1≤4,1≤x1≤4,1≤y1≤4,函數(shù)g()的功能定義為a1,a2為兩個(gè)參數(shù);
步驟4:計(jì)算G中的所有4D塊在4D-DCT域中在相同頻域坐標(biāo)位置上的交流系數(shù)所對(duì)應(yīng)的能量值,在不為(1,1,1,1)的情況下將G中的所有4D塊在4D-DCT域中在頻域坐標(biāo)位置上的交流系數(shù)所對(duì)應(yīng)的能量值記為然后將得到的255個(gè)能量值按順序排列構(gòu)成維數(shù)為255×1的能量向量,作為L對(duì)應(yīng)的能量向量,并記為E,E=[E1,E2,…,Ek,…,E255]T;其中,1≤k≤255,符號(hào)“[]”為向量或矩陣表示符號(hào),E1表示E中的第1個(gè)元素,E2表示E中的第2個(gè)元素,Ek表示E中的第k個(gè)元素,E255表示E中的第255個(gè)元素,k與的關(guān)系為:E1=e(1,1,1,2),E2=e(1,1,1,3),E255=e(4,4,4,4),上標(biāo)“T”表示向量或矩陣的轉(zhuǎn)置;
步驟5:提取出G中的所有4D塊在4D-DCT域中在相同頻域坐標(biāo)位置上的交流系數(shù)的振幅并構(gòu)成維數(shù)為1×SZ的振幅向量,在不為(1,1,1,1)的情況下將G中的所有4D塊在4D-DCT域中在頻域坐標(biāo)位置上的交流系數(shù)的振幅構(gòu)成的振幅向量記為然后對(duì)得到的每個(gè)振幅向量用韋伯概率分布進(jìn)行擬合,擬合后得到對(duì)應(yīng)的尺度參數(shù),將對(duì)用韋伯概率分布進(jìn)行擬合后得到的對(duì)應(yīng)的尺度參數(shù)記為再將得到的255個(gè)尺度參數(shù)按順序排列構(gòu)成維數(shù)為255×1的無符號(hào)系數(shù)分布特征向量,作為L對(duì)應(yīng)的無符號(hào)系數(shù)分布特征向量,并記為λ,λ=[λ1,λ2,…,λk,…,λ255]T;其中,符號(hào)“||”為取絕對(duì)值符號(hào),表示G中的第1個(gè)4D塊記為GB1對(duì)應(yīng)的頻域塊FB1中頻域坐標(biāo)位置為上的值,表示G中的第SZ個(gè)4D塊記為GBSZ對(duì)應(yīng)的頻域塊FBSZ中頻域坐標(biāo)位置為上的值,為的振幅,為的振幅,為的振幅,λ1表示λ的第1個(gè)元素,λ2表示λ的第2個(gè)元素,λk表示λ的第k個(gè)元素,λ255表示λ的第255個(gè)元素,k與的關(guān)系為:λ1=w(1,1,1,2),λ2=w(1,1,1,3),λ255=w(4,4,4,4);
步驟6:選取N幅用于訓(xùn)練的4維的無失真光場(chǎng)圖像,按照步驟1至步驟5的過程,以相同的方式獲取每幅無失真光場(chǎng)圖像對(duì)應(yīng)的能量向量和無符號(hào)系數(shù)分布特征向量;然后將N幅無失真光場(chǎng)圖像對(duì)應(yīng)的能量向量構(gòu)成訓(xùn)練的能量矩陣,記為ZE,ZE=[TE1,TE2,…,TEn,…,TEN],將N幅無失真光場(chǎng)圖像對(duì)應(yīng)的無符號(hào)系數(shù)分布特征向量構(gòu)成訓(xùn)練的無符號(hào)系數(shù)分布特征矩陣,記為ZW,ZW=[TW1,TW2,…,TWn,…,TWN];然后對(duì)ZE進(jìn)行主成分分析,獲得維數(shù)為255×m1的能量投影矩陣,記為同樣,對(duì)ZW進(jìn)行主成分分析,獲得維數(shù)為255×m2的無符號(hào)系數(shù)分布特征投影矩陣,記為其中,N≥100,無失真光場(chǎng)圖像的角度分辨率為U×V,無失真光場(chǎng)圖像的空間分辨率為X×Y,ZE和ZW的維數(shù)均為255×N,TE1表示第1幅無失真光場(chǎng)圖像對(duì)應(yīng)的能量向量,TE2表示第2幅無失真光場(chǎng)圖像對(duì)應(yīng)的能量向量,TEn表示第n幅無失真光場(chǎng)圖像對(duì)應(yīng)的能量向量,TEN表示第N幅無失真光場(chǎng)圖像對(duì)應(yīng)的能量向量,TW1表示第1幅無失真光場(chǎng)圖像對(duì)應(yīng)的無符號(hào)系數(shù)分布特征向量,TW2表示第2幅無失真光場(chǎng)圖像對(duì)應(yīng)的無符號(hào)系數(shù)分布特征向量,TWn表示第n幅無失真光場(chǎng)圖像對(duì)應(yīng)的無符號(hào)系數(shù)分布特征向量,TWN表示第N幅無失真光場(chǎng)圖像對(duì)應(yīng)的無符號(hào)系數(shù)分布特征向量,1≤n≤N,m1和m2均為正整數(shù),1≤m1+m2<N;
步驟7:對(duì)E進(jìn)行去中心化處理,得到去中心化處理后的能量向量,記為同樣,對(duì)λ進(jìn)行去中心化處理,得到去中心化處理后的無符號(hào)系數(shù)分布特征向量,記為然后用對(duì)進(jìn)行降維,得到L對(duì)應(yīng)的裁剪的能量向量,記為FE,同樣,用對(duì)進(jìn)行降維,得到L對(duì)應(yīng)的裁剪的無符號(hào)系數(shù)分布特征向量,記為FW,其中,和的維數(shù)為255×1,μZE為通過對(duì)ZE中的每行逐行求平均得到,即μZE中的第k個(gè)元素為ZE中的第k行的所有元素的平均值,μZW為通過對(duì)ZW中的每行逐行求平均得到,即μZW中的第k個(gè)元素為ZW中的第k行的所有元素的平均值,F(xiàn)E的維數(shù)為m1×1,F(xiàn)W的維數(shù)為m2×1;
步驟8:將FE和FW連接起來構(gòu)成的向量作為L的感知特征向量,記為F,F(xiàn)=[(FE)T,(FW)T];其中,F(xiàn)的維數(shù)為1×(m1+m2);
步驟9:將F作為輸入,結(jié)合支持向量回歸技術(shù),計(jì)算得到L的客觀質(zhì)量評(píng)價(jià)分?jǐn)?shù),記為Qpredict;其中,Qpredict越大,說明輸入的F對(duì)應(yīng)的光場(chǎng)圖像的質(zhì)量越好;反之,說明輸入的F對(duì)應(yīng)的光場(chǎng)圖像的質(zhì)量越差。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于寧波大學(xué),未經(jīng)寧波大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110244734.4/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。





