[發(fā)明專利]高分辨率單目2D視頻到雙目3D視頻的轉(zhuǎn)制方法有效

申請?zhí)枺?/td>	202011395559.0	申請日：	2020-12-03
公開（公告）號：	CN112543317B	公開（公告）日：	2022-07-12
發(fā)明（設(shè)計）人：	姚莉;李林鑫;楊俊宴;吳含前	申請（專利權(quán)）人：	東南大學(xué)
主分類號：	H04N13/261	分類號：	H04N13/261;H04N13/268;G06N3/04;G06K9/62;G06T3/40;G06T7/593;G06V10/774;G06V10/82
代理公司：	南京眾聯(lián)專利代理有限公司 32206	代理人：	許小莉
地址：	210096 ***	國省代碼：	江蘇;32
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	高分辨率視頻雙目轉(zhuǎn)制方法
鉆瓜網(wǎng) 技術(shù)展會專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【說明書】：

本發(fā)明公開一種高分辨率單目2D視頻到雙目3D視頻的轉(zhuǎn)制方法，在深度信息提取階段，使用現(xiàn)有的3D電影作為源數(shù)據(jù)集訓(xùn)練一個U型結(jié)構(gòu)的卷積網(wǎng)絡(luò)，得到性能優(yōu)越的網(wǎng)絡(luò)模型對2D視頻進(jìn)行逐幀的深度估計，利用小型的神經(jīng)網(wǎng)絡(luò)對深度圖進(jìn)行保邊平滑的優(yōu)化處理。在視點(diǎn)合成階段，提出無相機(jī)參數(shù)的基于深度圖的視點(diǎn)合成算法，采用對稱式的由中間向兩邊渲染的策略進(jìn)行左右虛擬視點(diǎn)合成。最后，在圖像修復(fù)階段，提出了結(jié)合時域信息的基于塊匹配的圖像修復(fù)算法，對左右視點(diǎn)中的裂痕空洞進(jìn)行填充修復(fù)。本發(fā)明能夠在原2D視頻無任何相關(guān)參數(shù)信息的前提下，對其進(jìn)行2D到3D的視頻轉(zhuǎn)制，不僅可以有效地處理高分辨率畫面，且轉(zhuǎn)制效果好、速度快。

技術(shù)領(lǐng)域

本發(fā)明涉及一種高分辨率單目2D視頻到雙目3D視頻的轉(zhuǎn)制方法，屬于圖像處理、計算機(jī)視覺和計算機(jī)圖形學(xué)領(lǐng)域。

背景技術(shù)

近些年來多媒體相關(guān)技術(shù)和硬件設(shè)備快速發(fā)展，市場上推出了各種3D和VR設(shè)備，如VR眼鏡、3D屏幕手機(jī)和3D顯示器等，與此同時用戶對于觀看3D視頻的娛樂需求也日益增長。然而對于普通的具有拍攝功能的移動設(shè)備，只能拍攝普通的單目2D視頻，目前市場上缺乏將2D視頻轉(zhuǎn)制為3D視頻的技術(shù)。無論是3D電影熒幕，VR眼鏡，或是3D屏幕手機(jī)和顯示器，都需要有豐富多樣的雙目3D視頻資源作為支撐，來為用戶提供具有立體感、沉浸感和視覺效果的3D視頻觀看體驗。單目2D視頻到雙目3D視頻的轉(zhuǎn)制技術(shù)正是解決這一問題的關(guān)鍵技術(shù)，可以極大地快速地豐富3D視頻資源庫。

目前主流的3D內(nèi)容制作分為兩種：一種是主動式拍攝獲取方法，一種是被動式計算機(jī)視覺計算方法。但是主動式方法對雙目攝像鏡頭的要求很高，要保證鏡頭、光圈、色度一致，兩路信號要同步，這使得立體拍攝的設(shè)備成本極高。被動式方法是通過后期的2D轉(zhuǎn)制3D技術(shù)來完成，即對單目2D視頻通過計算機(jī)視覺、計算機(jī)圖形學(xué)的方法估算出雙目3D視頻，這樣兩路視頻輸入顯示設(shè)備，可以獲得良好的3D視覺體驗效果。

2D視頻轉(zhuǎn)制3D視頻，需要先有2D視頻每幀畫面的深度信息作為基礎(chǔ)，其次通過基于深度信息的虛擬視點(diǎn)合成方法合成虛擬視點(diǎn)，然后對虛擬視點(diǎn)中的空洞和瑕疵進(jìn)行填充和修復(fù)。對于1080P的高分辨率視頻，圖像中的像素數(shù)量極大，轉(zhuǎn)制技術(shù)需要保證輸出的雙目3D視頻同樣是原先的高分辨率，并且紋理、色彩和語義信息準(zhǔn)確而合理，觀看時無模糊、目眩和失真等視覺感覺，畫面及內(nèi)容需要使觀看者在感到自然、流暢的基礎(chǔ)上，具有立體感、沉浸感的視覺享受。

高分辨率的單目2D視頻到雙目3D立體視頻的自動化轉(zhuǎn)制，目前主要面臨以下幾個難點(diǎn)：

1、視頻畫面的深度信息估計不夠準(zhǔn)確，虛擬視點(diǎn)合成需要質(zhì)量很高的深度圖，其所需深度圖需要達(dá)到像素級的準(zhǔn)確度和平滑度。

2、基于深度信息的虛擬視點(diǎn)合成，由于普通的視頻沒有相機(jī)參數(shù)等必要信息，因此進(jìn)一步提高了對深度圖質(zhì)量的要求，增大了虛擬視點(diǎn)合成的難度。

3、視頻是由連續(xù)的畫面構(gòu)成的，因此對于雙目的虛擬視點(diǎn)的空洞瑕疵的填充和修復(fù)，不僅要在單幀畫面上表現(xiàn)得清晰細(xì)膩和無偽影，而且要在畫面連續(xù)播放時連貫自然，無整體上和局部上的色彩、紋理的抖動和異變。

4、對于高分辨率的視頻畫面，其深度信息提取、虛擬視點(diǎn)合成、圖像空洞修復(fù)難度很大，不僅要保證2D-3D轉(zhuǎn)制的效果，而且要考慮計算機(jī)硬件的性能上限和處理速度。

發(fā)明內(nèi)容

本發(fā)明解決了上述問題和難點(diǎn)，提供了一種針對高分辨率單目2D視頻到雙目3D視頻的轉(zhuǎn)制方法，這種方法能夠?qū)Ω叻直媛实娜我獾?D視頻，在無相機(jī)參數(shù)和其他信息的前提下，無需人工操作的情況下，全自動地將輸入的單目2D視頻轉(zhuǎn)制為3D視頻，且保持原分辨率與畫質(zhì)效果。

為了實(shí)現(xiàn)上述目的，本發(fā)明的一種針對高分辨率單目2D視頻到雙目3D視頻的轉(zhuǎn)制方法，包括如下步驟：

步驟1：從現(xiàn)有的3D電影中提取左右?guī)捎肧GBM算法從中提取和構(gòu)建RGBD數(shù)據(jù)集；

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會員可以免費(fèi)下載。

免登錄下載普通用戶下載升級VIP會員，免費(fèi)下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于東南大學(xué)，未經(jīng)東南大學(xué)許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/202011395559.0/2.html，轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

上一篇：一種具有收緊機(jī)構(gòu)的打包機(jī)
下一篇：一種基于乘用車行程起終點(diǎn)的空間定位方法

同類專利

專利分類

H 電學(xué)

H04 電通信技術(shù)
H04N 圖像通信，如電視
H04N13-00 立體電視系統(tǒng)；其零部件
H04N13-02 .圖像信號發(fā)生器
H04N13-04 .圖像重現(xiàn)裝置

免登錄下載普通用戶下載升級VIP會員，免費(fèi)下載

專利文獻(xiàn)下載

說明：

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書；

2、支持發(fā)明專利、實(shí)用新型專利、外觀設(shè)計專利（升級中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進(jìn)行下載，點(diǎn)擊【登陸】【注冊】