[發明專利]一種視頻文本分割方法無效
| 申請號: | 201010606223.4 | 申請日: | 2010-12-24 |
| 公開(公告)號: | CN102043948A | 公開(公告)日: | 2011-05-04 |
| 發明(設計)人: | 黃磊;王修飛 | 申請(專利權)人: | 漢王科技股份有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100193 北京*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 視頻 文本 分割 方法 | ||
?
技術領域
本發明屬于圖像分割與智能視頻分析領域,涉及數字圖像處理和模式識別技術。
?
背景技術
隨著網絡與數字化媒體技術的不斷發展,大量多媒體信息不斷涌現,這使得基于內容的信息檢索成為迫切需求。視頻中的文字信息是一種高級語義特征,可以用于視頻分析、語義理解及檢索。如要提取視頻中的文字信息,視頻文本分割是其中非常關鍵的一步。視頻文本分割就是將視頻中經文本定位得到的文字區域分割為二值圖像,為后續OCR(Optical?Character?Recognition,光學字符識別)處理提供輸入。視頻文本分割步驟的性能對整個視頻文本信息的提取有著直接的影響。
已有的視頻文本分割方法主要有:基于閾值的分割方法、基于多幀融合的方法、基于顏色聚類的方法等。基于閾值的分割方法的基本原理是通過分析視頻解碼圖像中文本和背景層之間的像素值關系,從而獲取最優的分割閾值。由于這種方法的計算效率較高,其在圖像以及文本分割中應用比較廣泛。基于閾值的分割方法最早是用于掃描文檔分割,對于視頻文本,由于其背景比較復雜,且分辨率較低,直接采用這類方法一般難以取得好的分割效果。基于多幀融合的方法則是利用視頻幀間的冗余信息,通過對視頻中的文本進行運動分析,移除視頻幀間的運動量,保留不變量,從而達到文本分割的目的。這種方法由于采用了視頻幀間的冗余信息,所以其應用也存在一定的局限性,對于處在較為明顯場景變換中的視頻文本,該方法一般能取得較為不錯的分割結果,而對于場景變化不大的視頻文本,該類方法則無能為力。基于顏色聚類的方法的基本原理是通過顏色聚類,將視頻文本圖像分為多個圖層,然后通過對各個圖層的分析處理,達到視頻文本分割的目的。這種方法的效率比較低,在不能確定文本所屬圖層的情況下,需要消耗大量的時間來對各個圖層進行分析,且在視頻文本背景比較復雜的情況下,該方法也難以得到理想的分割結果。
?
發明內容
本發明所要解決的技術問題是提供一種視頻文本分割方法,迅速有效地將視頻文本從復雜背景中分割出來。
為了解決上述技術問題,本發明提供了一種視頻文本分割方法,包括:
步驟1:對輸入的視頻文本圖像進行預處理,使預處理后的視頻文本圖像具有統一的尺度,滿足下述步驟的處理要求;?
步驟2:利用一階高斯模型作為顏色分布模型來擬合預處理后的視頻文本圖像的顏色分布,根據所述預處理后的視頻文本圖像的筆畫圖來估計該分布模型的參數,并利用所述的顏色分布模型對預處理后的視頻文本圖像進行文本初分割,得到包含一定冗余信息的初分割結果圖;
步驟3:對所述初分割結果圖進行噪聲濾除,濾除所述冗余信息。
進一步來說,步驟1中所述預處理,包括:
對輸入的視頻文本行進行邊界擴充,對邊界擴充后的結果進行尺度歸一化。
進一步來說,步驟1中所述輸入的視頻文本圖像為灰度圖像。
進一步來說,所述尺度歸一化,包括:采用雙線性插值的方法對邊界擴充的結果進行尺度歸一化。
進一步來說,所述步驟2進一步包括:
步驟2a:提取預處理后的視頻文本圖像的筆畫圖;
步驟2b:計算所述提取的視頻文本圖像的筆畫圖的二值筆畫圖;
步驟2c:采用所述二值筆畫圖計算視頻文本圖像的顏色分布模型參數;
步驟2d:根據所述顏色分布模型對輸入的視頻文本圖像進行初分割。
進一步來說,所述的步驟2c中,視頻文本圖像的顏色分布模型采用一階高斯分布函數表示,為:
令????????????????????????????????????????????????
式中,表示點屬于文本像素的概率,為預處理后的灰度圖像中點的像素值;
高斯分布函數中的均值和方差,以二值筆畫圖為模板,在預處理后的灰度圖像上求二值筆畫圖對應區域的均值和方差,分別對應模型參數和,具體步驟包括:
1)在輸入圖像空間上,獲得預處理后的灰度圖像與二值筆畫圖的交集:
2)在上獲得模型參數和,包括:
令?;令
其中,?為集合中點的個數。
進一步來說,所述的步驟2d中,根據所述顏色分布模型對預處理后的文本圖像進行初分割,為:
令
式中,?和為步驟2c中獲得的高斯分布函數中的均值和方差,為預處理后的灰度圖像中點的像素值,為二值圖像中點的像素值。
進一步來說,所述步驟3中所述進行噪聲濾除,濾除所述冗余信息,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于漢王科技股份有限公司,未經漢王科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010606223.4/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種音頻信號檢測方法和裝置
- 下一篇:滑輪裝置





