[發明專利]基于字符切分和顏色聚類的數字視頻中的字符提取方法無效
| 申請號: | 200910081927.1 | 申請日: | 2009-04-08 |
| 公開(公告)號: | CN101515325A | 公開(公告)日: | 2009-08-26 |
| 發明(設計)人: | 黃曉冬;馬華東;張赫 | 申請(專利權)人: | 北京郵電大學 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/34 |
| 代理公司: | 北京德琦知識產權代理有限公司 | 代理人: | 夏憲富 |
| 地址: | 100876*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 字符 切分 顏色 數字視頻 中的 提取 方法 | ||
技術領域
本發明涉及一種數字圖像處理方法,確切地說,涉及一種基于字符切分和 顏色聚類的數字視頻中的字符提取方法,屬于圖像處理技術領域。
背景技術
數字視頻中的字符信息是理解視頻內容高層語義的重要線索,有效地提取 這些字符對內容理解以及基于內容的多媒體信息檢索系統來說是一項重要的技 術。目前,光學字符識別(OCR)技術對于二值圖像中的字符識別已經趨于成 熟,并進入了商業應用。現在,許多不同來源的字符都是通過OCR系統識別的。 因此,如何使得輸入的字符圖像能夠符合OCR的識別要求,已經成為一項公認 的必須達到的目標。當前,OCR系統面向的大都是由掃描儀掃描出來的文件圖 像,要求圖像中的字符清晰、背景單一、分辨率高,并且,多數OCR都要求以 二值化圖像作為輸入。
但是,因為視頻中的字符的噪聲干擾通常比較嚴重,且背景復雜,字符模 糊,字符與背景的對比度不能得到保證,故分辨率比較低。因此,如何對視頻 中的字符實現有效提取就具有很大的挑戰性,這也限制了OCR技術在視頻檢索 中的成功應用。作為視頻檢索中關鍵步驟的字符提取,其目標就是把含有字符 區域的復雜圖像,轉化成能夠為OCR所識別的清晰的二值化圖像。
目前,國內外的研究人員在字符提取技術方面研制了很多方法。現有的提 取方法可分為:基于顏色閾值的方法、基于連通區域分析的方法、基于顏色模 型的方法和聚類法等等。其中:
基于顏色閾值的方法是假定圖像中文字的亮度總是比背景高或者比背景 低,再通過估計背景顏色和前景顏色的閾值來實現分割的目的。文字的閾值又 分為兩種:全局閾值和局部閾值,全局閾值是整個圖像都使用的一個閾值;局 部閾值是根據圖像的具體區域來確定的閾值,與全局閾值相比,后者優點是能 處理亮度和對比度發生變化的圖像。基于顏色閾值的方法最早來源于文檔圖像 分析,在處理背景簡單的文檔圖像時,該方法簡單、實用而有效,但是當背景 復雜起來時,由于圖像中的文字顏色和背景顏色之間不存在簡單的閾值,因而 這種簡單的方法就無能為力了。
基于連通分量分析的方法是利用文字筆畫具有連通性的特征,這種方法是 先將輸入的圖片分割成一系列的連通分量,然后通過自底向上的方法分析和確 定每個分量屬于前景還是背景,最后將所有前景分量組合成分割結果。由于該 方法對文字的筆畫是作為整體進行處理的,因此,分割結果的筆畫的連貫性比 較好,易于被OCR軟件所識別;但是,該算法復雜度高,系統效率低。
基于顏色模型的方法是先通過機器學習的方法為文字像素建立一個顏色模 型,然后利用該模型計算圖片中每一個像素屬于文字像素的概率,超過某個概 率閾值的像素被標記為文字像素。由于基于顏色模型的方法考慮了文字顏色的 多峰值分布,因而能夠處理比較復雜的背景,但是對不同的圖像,其文字的顏 色模型往往差別很大,為多種不同的圖像分別建立不同的模型很不容易,有時 候甚至是不可能的。
聚類法是假定文字塊中所有像素都能根據顏色分為K類,文字像素對應于 其中一類,運用經典的聚類算法K-means對所有像素進行聚類。類似的聚類方 法還有基于顏色相似性度量的顏色削減算法等,所不同的是K-means算法需要 給定類的個數K,后者是根據顏色相似性度量自動生成類的個數。這類方法可 以用于復雜背景的情形,但是當背景中含有與文字顏色相同或相近的成分時, 這些成分會被誤分入文字類,從而產生大量的殘余背景,影響OCR識別。
總之,相應的幾種字符提取技術在許多方面都有不盡人意之處,因此,如 何研制一種較好的用于視頻圖像中的字符提取方法,就成為業內科技人員關注 的新課題。
發明內容
有鑒于此,本發明的目的是提供一種基于字符切分和顏色聚類的數字視頻 中的字符提取方法,該方法能夠較好地解決現有技術存在的缺陷,使得原來復 雜而不能被OCR識別的圖像中的字符,變成清晰的、二值化的、可供OCR識 別的字符圖像。
為了達到上述目的,本發明提供了一種基于字符切分和顏色聚類的數字視 頻中的字符提取方法,其特征在于,包括下列操作步驟:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京郵電大學,未經北京郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200910081927.1/2.html,轉載請聲明來源鉆瓜專利網。





