[發明專利]一種視頻文本分割方法無效

申請號：	201010606223.4	申請日：	2010-12-24
公開（公告）號：	CN102043948A	公開（公告）日：	2011-05-04
發明（設計）人：	黃磊;王修飛	申請（專利權）人：	漢王科技股份有限公司
主分類號：	G06K9/00	分類號：	G06K9/00;G06K9/62
代理公司：	暫無信息	代理人：	暫無信息
地址：	100193 北京***	國省代碼：	北京;11
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	一種視頻文本分割方法
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

技術領域

本發明屬于圖像分割與智能視頻分析領域，涉及數字圖像處理和模式識別技術。

背景技術

隨著網絡與數字化媒體技術的不斷發展，大量多媒體信息不斷涌現，這使得基于內容的信息檢索成為迫切需求。視頻中的文字信息是一種高級語義特征，可以用于視頻分析、語義理解及檢索。如要提取視頻中的文字信息，視頻文本分割是其中非常關鍵的一步。視頻文本分割就是將視頻中經文本定位得到的文字區域分割為二值圖像，為后續OCR（Optical?Character?Recognition，光學字符識別）處理提供輸入。視頻文本分割步驟的性能對整個視頻文本信息的提取有著直接的影響。

已有的視頻文本分割方法主要有：基于閾值的分割方法、基于多幀融合的方法、基于顏色聚類的方法等?；陂撝档姆指罘椒ǖ幕驹硎峭ㄟ^分析視頻解碼圖像中文本和背景層之間的像素值關系，從而獲取最優的分割閾值。由于這種方法的計算效率較高，其在圖像以及文本分割中應用比較廣泛?；陂撝档姆指罘椒ㄗ钤缡怯糜趻呙栉臋n分割，對于視頻文本，由于其背景比較復雜，且分辨率較低，直接采用這類方法一般難以取得好的分割效果?；诙鄮诤系姆椒▌t是利用視頻幀間的冗余信息，通過對視頻中的文本進行運動分析，移除視頻幀間的運動量，保留不變量，從而達到文本分割的目的。這種方法由于采用了視頻幀間的冗余信息，所以其應用也存在一定的局限性，對于處在較為明顯場景變換中的視頻文本，該方法一般能取得較為不錯的分割結果，而對于場景變化不大的視頻文本，該類方法則無能為力?；陬伾垲惖姆椒ǖ幕驹硎峭ㄟ^顏色聚類，將視頻文本圖像分為多個圖層，然后通過對各個圖層的分析處理，達到視頻文本分割的目的。這種方法的效率比較低，在不能確定文本所屬圖層的情況下，需要消耗大量的時間來對各個圖層進行分析，且在視頻文本背景比較復雜的情況下，該方法也難以得到理想的分割結果。

發明內容

本發明所要解決的技術問題是提供一種視頻文本分割方法，迅速有效地將視頻文本從復雜背景中分割出來。

為了解決上述技術問題，本發明提供了一種視頻文本分割方法，包括：

步驟1：對輸入的視頻文本圖像進行預處理，使預處理后的視頻文本圖像具有統一的尺度，滿足下述步驟的處理要求；?

步驟2：利用一階高斯模型作為顏色分布模型來擬合預處理后的視頻文本圖像的顏色分布，根據所述預處理后的視頻文本圖像的筆畫圖來估計該分布模型的參數，并利用所述的顏色分布模型對預處理后的視頻文本圖像進行文本初分割，得到包含一定冗余信息的初分割結果圖；

步驟3：對所述初分割結果圖進行噪聲濾除，濾除所述冗余信息。

進一步來說，步驟1中所述預處理，包括：

對輸入的視頻文本行進行邊界擴充，對邊界擴充后的結果進行尺度歸一化。

進一步來說，步驟1中所述輸入的視頻文本圖像為灰度圖像。

進一步來說，所述尺度歸一化，包括：采用雙線性插值的方法對邊界擴充的結果進行尺度歸一化。

進一步來說，所述步驟2進一步包括：

步驟2a：提取預處理后的視頻文本圖像的筆畫圖；

步驟2b：計算所述提取的視頻文本圖像的筆畫圖的二值筆畫圖；

步驟2c：采用所述二值筆畫圖計算視頻文本圖像的顏色分布模型參數；

步驟2d：根據所述顏色分布模型對輸入的視頻文本圖像進行初分割。

進一步來說，所述的步驟2c中，視頻文本圖像的顏色分布模型采用一階高斯分布函數表示，為：

令????????????????????????????????????????????????

式中，表示點屬于文本像素的概率，為預處理后的灰度圖像中點的像素值；

高斯分布函數中的均值和方差，以二值筆畫圖為模板，在預處理后的灰度圖像上求二值筆畫圖對應區域的均值和方差，分別對應模型參數和，具體步驟包括：

1）在輸入圖像空間上，獲得預處理后的灰度圖像與二值筆畫圖的交集：

2）在上獲得模型參數和，包括：

令?；令

其中，?為集合中點的個數。

進一步來說，所述的步驟2d中，根據所述顏色分布模型對預處理后的文本圖像進行初分割，為：

令

式中，?和為步驟2c中獲得的高斯分布函數中的均值和方差，為預處理后的灰度圖像中點的像素值，為二值圖像中點的像素值。

進一步來說，所述步驟3中所述進行噪聲濾除，濾除所述冗余信息，包括：

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于漢王科技股份有限公司，未經漢王科技股份有限公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201010606223.4/2.html，轉載請聲明來源鉆瓜專利網。

同類專利

專利分類

G 物理

G06 計算；推算；計數
G06K 數據識別；數據表示；記錄載體；記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形，例如，指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正，例如，用重復掃描圖形的方法
G06K9-18 .應用具有附加代碼標記或含有代碼標記的打印字符的，例如，由不同形狀的各個筆畫組成的，而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預處理，即無須判定關于圖像的同一性而進行的圖像信息處理
G06K9-60 .圖像捕獲和多種預處理作用的組合

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產權局專利說明書；

2、支持發明專利、實用新型專利、外觀設計專利（升級中）；

3、專利數據每周兩次同步更新，支持Adobe PDF格式；

4、內容包括專利技術的結構示意圖、流程工藝圖或技術構造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】