[發(fā)明專利]基于幀間信息的視頻文字處理方法無效

申請?zhí)枺?/td>	201110391472.0	申請日：	2011-11-30
公開（公告）號：	CN102521805A	公開（公告）日：	2012-06-27
發(fā)明（設(shè)計）人：	田巖;許毅平;文灝;陳柱;孫福生	申請（專利權(quán)）人：	華中科技大學(xué)
主分類號：	G06T5/00	分類號：	G06T5/00
代理公司：	華中科技大學(xué)專利中心 42201	代理人：	朱仁玲
地址：	430074 湖北***	國省代碼：	湖北;42
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	基于信息視頻文字處理方法
鉆瓜網(wǎng) 技術(shù)展會專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【說明書】：

技術(shù)領(lǐng)域

本發(fā)明屬于視頻圖像處理應(yīng)用領(lǐng)域，具體涉及一種基于幀間信息的視頻文字處理方法。

背景技術(shù)

視頻圖像處理中，文字提取以及圖像信息修復(fù)都有著十分廣泛的應(yīng)用前景，因此，近年來也越來越受到人們的重視。

然而目前自動定位圖像中文本區(qū)域的方法對于某些復(fù)雜背景中的文字也很難做到完整的檢測與提取。目前的圖像修復(fù)算法主要可以分成兩大類基于PDE的修復(fù)方法和基于紋理的修復(fù)方法。主要分別體現(xiàn)了推測與尋優(yōu)兩種不同的思路。這些方法往往基于圖像處理，忽略了視頻幀在時間上的相關(guān)性，從而導(dǎo)致修復(fù)結(jié)果不準(zhǔn)確，且修復(fù)結(jié)果在播放時容易出現(xiàn)閃爍，跳變等現(xiàn)象。

發(fā)明內(nèi)容

本發(fā)明的目的在于提供一種基于幀間信息的視頻文字處理方法，其能夠解決現(xiàn)有方法中修復(fù)結(jié)果不準(zhǔn)確、且修復(fù)結(jié)果在播放時容易出現(xiàn)閃爍，跳變等問題。

本發(fā)明是通過以下技術(shù)方案實(shí)現(xiàn)的：

一種基于幀間信息的視頻文字處理方法，包括如下步驟：

(1)檢測當(dāng)前圖像的文本區(qū)域R(x，y，t)，設(shè)當(dāng)前圖像為f(x，y，t)，其前面的N幅圖像依次為f(x，y，t-1)，…，f(x，y，t-N)，這N幅圖像對應(yīng)的文本區(qū)域分別為R(x，y，t-1)，…，R(x，y，t-N)，其中x代表當(dāng)前圖像的橫坐標(biāo)，y代表當(dāng)前圖像的縱坐標(biāo)，t代表當(dāng)前圖像的幀數(shù)；

(2)對當(dāng)前圖像f(x，y，t)的文本區(qū)域R(x，y，t)進(jìn)行校驗(yàn)，具體包含以下子步驟：

(21)判斷文本區(qū)域t中的子區(qū)域是否在文本區(qū)域中出現(xiàn)過；

(22)若沒有出現(xiàn)過，則可確定該子區(qū)域是虛警區(qū)域，并將該子區(qū)域排除，并將文本區(qū)域R(x，y，t)更新為R_new(x，y，t)，其中R_new(x，y，t)為當(dāng)前圖像中的待修復(fù)區(qū)域；

(23)若出現(xiàn)過，則繼續(xù)對文本區(qū)域R(x，y，t)中其他子區(qū)域進(jìn)行校驗(yàn)；

(3)從前往后對文本區(qū)域R(x，y，t)進(jìn)行背景修復(fù)，具體包含以下子步驟：

(31)分析當(dāng)前圖像f(x，y，t)及其前N幀的運(yùn)動偏移，如果運(yùn)動較大，直接對下一幀進(jìn)行處理；如果運(yùn)動較小，則進(jìn)行步驟(32)；

(32)將當(dāng)前圖像的文本區(qū)域R_new(x，y，t)及其前N幀的文本區(qū)域R(x，y，t-1)，…，R(x，y，t-N)進(jìn)行比較，得到當(dāng)前圖像中可利用幀間信息修復(fù)的區(qū)域?yàn)镽_new(x，y，t)-R(x，y，t-1)，…，R_new(x，y，t)-R(x，y，t-N)；

(33)對當(dāng)前圖像f(x，y，t)中的區(qū)域，在前N幀中搜索最佳匹配塊完成修復(fù)，并更新R_new(x，y，t)；

(34)重復(fù)步驟(3)對后面一幀進(jìn)行處理，直至處理完整段視頻。(4)從最后一幀開始往前進(jìn)行背景修復(fù)，具體包含以下子步驟：

(41)分析當(dāng)前圖像f(x，y，t)與后N幀的運(yùn)動偏移，如果運(yùn)動較大，直接對前面一幀進(jìn)行處理，如果運(yùn)動較小，則進(jìn)行步驟(42)；

(42)將當(dāng)前圖像的文本區(qū)域R_new(x，y，t)與后N幀的文本區(qū)域R(x，y，t+1)，…，R(x，y，t+N)進(jìn)行比較，得到當(dāng)前圖像中可利用幀間信息修復(fù)的區(qū)域?yàn)镽_new(x，y，t)-R(x，y，t+1)，…，R_new(x，y，t)-R(x，y，t+N)；

(43)對當(dāng)前圖像f(x，y，t)中的區(qū)域，在后N幀中搜索最佳匹配塊完成修復(fù)，并更新R_new(x，y，t)；

(44)如果此時那么對剩余的文本區(qū)域，在本幀中搜索最佳的匹配塊進(jìn)行修復(fù)；否則重復(fù)步驟(4)對前面一幀進(jìn)行處理，直到處理完整段視頻。

本發(fā)明的方法具有以下優(yōu)點(diǎn)：(1)基于視頻文字字幕的連續(xù)性，本發(fā)明方法提出利用幀間信息校驗(yàn)檢測區(qū)域，來提高區(qū)域定位的準(zhǔn)確性；(2)基于視頻內(nèi)容的連續(xù)性，本發(fā)明方法利用幀間可用信息來完成修復(fù)，這樣既能既能快速的找到最佳匹配信息，又保證了修復(fù)結(jié)果的正確性；(3)本發(fā)明方法將每次修復(fù)的結(jié)果都作為下一次修復(fù)的可用信息，不斷累積和延續(xù)修復(fù)結(jié)果的連續(xù)性，可以很大程度上減少圖像處理方法所產(chǎn)生的幀間閃爍和跳變。總而言之，本發(fā)明可保證檢測定位的準(zhǔn)確性，保證修復(fù)結(jié)果的正確性，保證視頻結(jié)果的時間連續(xù)性。

附圖說明

圖1(a)為原始圖像。

圖1(b)示出經(jīng)過現(xiàn)有技術(shù)方法處理后的圖像。

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會員可以免費(fèi)下載。

免登錄下載普通用戶下載升級VIP會員，免費(fèi)下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于華中科技大學(xué)，未經(jīng)華中科技大學(xué)許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201110391472.0/2.html，轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

上一篇：氣態(tài)物質(zhì)的分析裝置及方法
下一篇：微小型光電式雙向行程限位裝置

同類專利

專利分類

G 物理

G06 計算；推算；計數(shù)
G06T 一般的圖像數(shù)據(jù)處理或產(chǎn)生
G06T5-00 圖像的增強(qiáng)或復(fù)原，如從位像到位像地建立一個類似的圖形
G06T5-10 .利用非空間域?yàn)V波的
G06T5-20 .利用局部操作的
G06T5-40 .使用直方圖技術(shù)的
G06T5-50 .通過使用多于一幅圖像的，例如平均、減少
G06T5-30 ..侵蝕或擴(kuò)張，如變薄

免登錄下載普通用戶下載升級VIP會員，免費(fèi)下載

專利文獻(xiàn)下載

說明：

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書；

2、支持發(fā)明專利、實(shí)用新型專利、外觀設(shè)計專利（升級中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進(jìn)行下載，點(diǎn)擊【登陸】【注冊】