[發(fā)明專利]一種基于三維自組織映射的立體圖像編碼方法在審
| 申請?zhí)枺?/td> | 201410734545.5 | 申請日: | 2014-12-05 |
| 公開(公告)號: | CN104363460A | 公開(公告)日: | 2015-02-18 |
| 發(fā)明(設(shè)計)人: | 徐曉寧;覃遠年;朱輝 | 申請(專利權(quán))人: | 桂林電子科技大學 |
| 主分類號: | H04N19/597 | 分類號: | H04N19/597;H04N19/154 |
| 代理公司: | 桂林市華杰專利商標事務(wù)所有限責任公司 45112 | 代理人: | 唐修豪 |
| 地址: | 541004 廣西*** | 國省代碼: | 廣西;45 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 三維 組織 映射 立體 圖像 編碼 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及圖像處理領(lǐng)域,具體為一種基于三維自組織映射的立體圖像編碼方法。
背景技術(shù)
立體圖像增加了景物的深度信息,具有強烈的臨場感和真實感,因此正越來越受到人們的追捧,立體圖像目前應(yīng)用最廣泛的是雙目視圖方案,利用雙目視差原理產(chǎn)生立體感,但與二維平面圖像相比,立體圖像數(shù)據(jù)量成倍的增加了,因此,需要對立體圖像進行壓縮編碼,以便能有效地傳輸和存儲。
為了解決上述問題,目前主要的立體圖像編碼方法有基于小波法、與MPEG(Moving?Pictures?Experts?Group,動態(tài)圖像專家組)標準結(jié)合基于塊的方法以及基于模式識別的編碼方法。
方法1:基于小波的立體圖像編碼方法對參考圖像和估計的視差圖都采用小波變換編碼,而視差估計則采用簡化的塊圖像匹配方法,該方法雖然大大降低計算復雜度,但當壓縮比較高時,重建圖像的質(zhì)量較差。
方法2:與MPEG標準結(jié)合的算法是當前在實際中使用較多的方案,該方案使用JPEG(Joint?Photographic?Experts?Group,聯(lián)合圖像專家組)標準對左圖像進行編碼,利用視差估計技術(shù)從重建左圖像獲取預測右圖像,預測誤差也使用類似于JPEG標準的方法進行編碼,該方案雖考慮到了左右圖像之間的相關(guān)性,但壓縮效率仍較低,且重建圖像存在明顯的塊效應(yīng)。
方法3:基于模式識別的立體圖像編碼方法是一種新的圖像編碼方法,該方法對右圖像采用DE(Disparity?Estimation,視差估計)補償技術(shù)編碼,對左圖像則使用基于SOM(Self-organizing?Map,自組織映射)算法的矢量量化編碼來取代傳統(tǒng)的JPEG方法,矢量量化與視差估計的殘差均使用DCT(Discrete?Cosine?Transform,離散余弦變換)+霍夫曼進行編碼,該方法能較好的克服變換編碼適應(yīng)性不足的缺點且壓縮效率較高,但計算復雜度高,同時也存在一定的方塊效應(yīng)。
發(fā)明內(nèi)容
針對現(xiàn)有技術(shù)的不足,本發(fā)明提供一種基于三維自組織映射的立體圖像編碼方法,該方法降低了算法計算復雜度,提高了左圖像的編碼效率同時明顯降低了重建右圖的方塊效應(yīng)。
實現(xiàn)本發(fā)明目的的技術(shù)方案是:
一種基于三維自組織映射的立體圖像編碼方法,包括如下步驟:
1)采用3DSOM(Three-dimensional?Self-organizing?Map,三維自組織映射)算法對左右圖像進行分塊學習訓練,獲得最優(yōu)的矢量量化碼書;
2)將左圖作為輸入矢量,進行基于3DSOM的矢量量化編碼,由左圖和矢量量化碼矢獲得矢量量化誤差,并對其進行DCT變換、量化和霍夫曼編碼;
3)對編碼后的碼流進行解碼,由解碼后的矢量量化誤差和矢量量化碼矢對左圖進行重建,即將解碼后得到的矢量量化誤差和矢量量化碼矢進行求和匹配運算,得到重建左圖;
4)將立體圖像對中的右圖進行分塊,利用重建左圖,使用固定塊視差估計補償技術(shù)獲得右圖的預測圖像及視差矢量;
5)由右圖的預測圖像和右圖進行做差運算得到視差估計誤差,對視差估計誤差圖像分塊進DCT變換、量化和霍夫曼編碼;
6)在解碼端由重建左圖、視差估計誤差和視差矢量對右圖進行重建,從而實現(xiàn)了對立體圖像的有效編碼。
步驟1中,設(shè)置自組織神經(jīng)網(wǎng)絡(luò)大小為(N,M),其中N為碼書大小,即輸出層輸出神經(jīng)元的個數(shù),M為輸入訓練矢量的大小,訓練矢量集為S={X1,X2…,XM},網(wǎng)絡(luò)輸入節(jié)點為k(等于矢量維數(shù)),各輸入節(jié)點到各輸出節(jié)點的權(quán)值為Wji,l=1,2…,k,j=1,2…,N,失真測度為d(xi,wj),一般采用均方誤差準則。
采用頻率敏感函數(shù)對失真測度進行修正,即
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于桂林電子科技大學,未經(jīng)桂林電子科技大學許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410734545.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 一種三維彩色物品制作方法
- 三維內(nèi)容顯示的方法、裝置和系統(tǒng)
- 三維對象搜索方法、裝置及系統(tǒng)
- 三維會話數(shù)據(jù)展示方法、裝置、存儲介質(zhì)和計算機設(shè)備
- 一種三維模型處理方法、裝置、計算機設(shè)備和存儲介質(zhì)
- 用于基于分布式賬本技術(shù)的三維打印的去中心化供應(yīng)鏈
- 標記數(shù)據(jù)的獲取方法及裝置、訓練方法及裝置、醫(yī)療設(shè)備
- 一種基于5G網(wǎng)絡(luò)的光場三維浸入式體驗信息傳輸方法及系統(tǒng)
- 用于機器人生產(chǎn)系統(tǒng)仿真的三維場景管理與文件存儲方法
- 基于三維形狀知識圖譜的三維模型檢索方法及裝置





