[發(fā)明專利]一種適用于立體視頻的立體字幕添加位置自動(dòng)選擇方法有效
| 申請(qǐng)?zhí)枺?/td> | 201810359913.0 | 申請(qǐng)日: | 2018-04-20 |
| 公開(公告)號(hào): | CN108712642B | 公開(公告)日: | 2020-07-10 |
| 發(fā)明(設(shè)計(jì))人: | 侯春萍;岳廣輝;楊陽(yáng);李北辰 | 申請(qǐng)(專利權(quán))人: | 天津大學(xué) |
| 主分類號(hào): | H04N13/183 | 分類號(hào): | H04N13/183;H04N5/278 |
| 代理公司: | 天津市北洋有限責(zé)任專利代理事務(wù)所 12201 | 代理人: | 程毓英 |
| 地址: | 300072*** | 國(guó)省代碼: | 天津;12 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 適用于 立體 視頻 字幕 添加 位置 自動(dòng) 選擇 方法 | ||
本發(fā)明涉及一種適用于立體視頻的立體字幕添加位置自動(dòng)選擇方法,包括下列步驟:立體圖像視差計(jì);立體字幕初步位置判定;最優(yōu)字幕位置及視差選擇:考慮到視差值越小越容易引起觀看不舒適,將視差數(shù)據(jù)集P進(jìn)行從大到小進(jìn)行排序,選取數(shù)值較小且頻率較高的數(shù)值作為立體字幕添加時(shí)候的最終視差值df,對(duì)于該視差值條件下可能會(huì)對(duì)應(yīng)著多個(gè)候選區(qū)域,設(shè)這些區(qū)域?qū)?yīng)的坐標(biāo)組成集合,則立體字幕最終的坐標(biāo)位置通過從集合中選擇距離坐標(biāo)點(diǎn)距離最近的坐標(biāo)位置來確定。
技術(shù)領(lǐng)域
本發(fā)明屬于視頻處理領(lǐng)域,涉及自動(dòng)選擇立體字幕的位置以提高觀看舒適度的問題。
背景技術(shù)
隨著電子科技、網(wǎng)絡(luò)技術(shù)的快速發(fā)展,數(shù)字圖像在人們?nèi)粘I钪械玫綇V泛應(yīng)用。近年來立體圖像快速發(fā)展,已經(jīng)成功應(yīng)用于廣告、電視、有戲及電影等各個(gè)領(lǐng)域,與人們的生活息息相關(guān)。字幕作為輔佐圖片內(nèi)容的工具,對(duì)人類理解視頻信息至關(guān)重要。現(xiàn)階段,視頻的字幕主要依賴于后期人工添加,這種方式耗時(shí)耗力,不利于立體信息領(lǐng)域的快速發(fā)展。而且,基于經(jīng)驗(yàn)的字幕添加常常導(dǎo)致字幕與圖像內(nèi)容的遮擋,極大地降低了觀看體驗(yàn)。相較于傳統(tǒng)2D字幕,立體字幕需要將深度信息考慮在內(nèi),因立體字幕的添加更具挑戰(zhàn)。本發(fā)明試圖在基于觀看舒適度提高的前提下,選取最優(yōu)的位置對(duì)立體字幕進(jìn)行添加。因此,本發(fā)明試圖自動(dòng)選擇立體字幕的位置以提高觀看舒適度的問題。
發(fā)明內(nèi)容
本發(fā)明的目的基于觀看舒適度增強(qiáng)的前提下,提出一種自動(dòng)選擇立體字幕位置的方案。技術(shù)方案如下:
一種適用于立體視頻的立體字幕添加位置自動(dòng)選擇方法步驟如下:
第一步:立體圖像視差計(jì)算
對(duì)于立體圖像對(duì)Is,首先應(yīng)用光流法計(jì)算其視差圖D;
第二部:立體字幕初步位置判定,首先設(shè)定如下的A-C原則:
A.對(duì)于立體圖像選取上區(qū)域和下區(qū)域兩個(gè)區(qū)域作為字幕添加的候選區(qū)域,上區(qū)域范圍為其中W和H分別表示圖像的寬和高,下區(qū)域的范圍為
B.考慮將字幕添加在屏幕外邊更靠近觀看者的一端,以提高觀看立體感受;
C.基于光流法的視差圖,當(dāng)立體字幕在屏幕外邊更靠近觀看者的一端,視差值是負(fù)值;
立體字幕的初步位置由以下幾步實(shí)現(xiàn):
1)對(duì)于待插入字幕Ω,在首先在上述定義的下區(qū)域內(nèi)左上方選取與Ω同樣大小的區(qū)域Λ用于字幕插入的初始候選區(qū)域,對(duì)于Λ,首先計(jì)算其內(nèi)部所有視差的均值μ,其次,計(jì)算所有視差值的方差δ;對(duì)于區(qū)域Λ內(nèi),若一個(gè)像素的視差值在[μ-δ,μ+δ]之外,則認(rèn)為該點(diǎn)是奇異點(diǎn);如果整個(gè)區(qū)域內(nèi)奇異點(diǎn)的個(gè)數(shù)與N的比值小于0.1且均值μ小于1°,視差最小值大于-1°,則認(rèn)為該區(qū)域適合添加字幕,可以作為字幕添加的候選區(qū)域,其中心像素點(diǎn)坐標(biāo)(Λx,Λy)作為候選字幕插入位置;字幕的視差設(shè)為dmin-0.106°,其中dmin表示該區(qū)域內(nèi)最小視差值;
2)對(duì)于上區(qū)域,根據(jù)從左到右,從上到下的順序?qū)γ恳粋€(gè)Λ進(jìn)行步驟1)的操作,可以獲得多個(gè)候選區(qū)域,對(duì)應(yīng)生成一個(gè)坐標(biāo)數(shù)據(jù)集C和一個(gè)視差數(shù)據(jù)集P;
3)如果對(duì)于下區(qū)域所有的區(qū)域Λ不存在適合字幕添加的候選區(qū)域,則將下區(qū)域換成上區(qū)域繼續(xù)重復(fù)上述操作1)-2),若上下區(qū)域都不具備候選區(qū)域,則判定該圖像不適合添加立體字幕;
第三步:最優(yōu)字幕位置及視差選擇
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于天津大學(xué),未經(jīng)天津大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810359913.0/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。





