[發明專利]一種從圖像中提取文本的方法和裝置有效
| 申請號: | 200910241565.8 | 申請日: | 2009-11-26 |
| 公開(公告)號: | CN102081731A | 公開(公告)日: | 2011-06-01 |
| 發明(設計)人: | 舒波;孔軼;陳東明;李英;黃昭文;李志鋒;呂漢鑫;黃克書;林茂;陳濤;雷志勇;余士韜 | 申請(專利權)人: | 中國移動通信集團廣東有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/46;G06K9/62;G06F17/30 |
| 代理公司: | 北京銀龍知識產權代理有限公司 11243 | 代理人: | 許靜 |
| 地址: | 510100 廣東省*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 圖像 提取 文本 方法 裝置 | ||
技術領域
本發明屬于模式識別與計算機視覺技術領域,特別涉及一種從圖像中提取文本的方法和裝置。
背景技術
隨著多媒體信息檢索、互聯網和3G網絡流媒體技術的發展,圖像和視頻已成為現今多媒體信息交流和服務的主流信息載體。圖像和視頻中的文字信息對海量信息的表達和檢索也就顯得愈來愈重要,如何實現圖像中文字的自動檢測與提取是實現基于文字信息的圖像檢索和圖像敏感性判別的第一步。
圖像中的文本區域有顯著區別于非文本區域的特征,如文本區域具有豐富的邊緣、特殊的紋理,通常文本區域由一行或多行文字構成,且排列一般為水平或垂直方向,文字的顏色一致且與背景有較強的對比度。這些特征可用于圖像中文本和非文本區域的鑒別。對圖像中文本信息的檢測、提取和識別的主要方法是利用文本區域的上述特征和規律等先驗知識定位文本區域,然后對文本區域進行圖像質量增強,通過二值化處理將文本與背景分離,通過OCR軟件對文本區域進行字符提取與識別。
文本區域提取方法主要包含基于區域的方法和基于紋理的方法兩大類?;趨^域的方法利用圖像中的文本區域與背景的顏色灰度差異為特征,進行文本區域的檢測。采用自底向上的策略,先將圖像分成很多子圖像,然后根據子圖像信息結構確定出文本區域,再利用文字尺寸大小、文字長寬比和文字行投影等特征做進一步篩選,最終確定文本區域。這種方法對文字大小、字體不敏感,運算速度較快。
根據子圖像信息結構的不同,基于區域的方法又可分為基于連通域和基于邊緣檢測的方法?;谶B通域的方法假定圖像中文字的顏色一致,利用顏色聚類確定出候選的文字區域,再利用啟發式規則進行文字區域篩選?;谶吘墮z測的方法利用文字和背景具有相對較高的對比度,先檢測出邊緣,然后用形態學算子將邊緣連接成為文字區域,最后利用啟發式規則進行篩選。
基于紋理的方法是把文字區域看成是特殊的紋理,利用文本區域與背景區域的不同紋理特性進行文字的檢測、提取與識別。一般定義一個像素窗口,以一定步長對圖像進行滑動掃描,檢測出小區域紋理,利用訓練好的分類器判斷當前小區域是否為文本區域,最后合并所有的文本小區域形成候選文本區域,在此基礎上完成文字的提取與識別。通常,在復雜背景下,基于紋理的方法比基于連通域的方法更具魯棒性,且通用性比較好。
現有技術的方法中,基于區域的方法在圖像背景復雜或者圖像質量較差時,很難抽取準確的連通域,另外在文字區域的篩選時所采用的啟發式規則的制定依賴于先驗知識,而這些先驗知識一般很難準確地獲得,并且很多閾值的確定都是剛性的,導致算法的魯棒性比較差。
基于紋理的方法雖然通用性較好,但計算復雜,運算代價高,而且它對文字大小和字體比較敏感,導致分類器的通用性和文字區域的定位精度較低。當圖像背景中包含類似文字的周期結構紋理時,該類方法也會遇到困難。
發明內容
本發明所要解決的技術問題是提供一種從圖像中提取文本的方法和裝置,以提高文本檢測的準確性和魯棒性。
為解決上述技術問題,本發明提供技術方案如下:
一種從圖像中提取文本的方法,包括:
對原始圖像進行灰度級的非線性動態壓縮,得到增強圖像;
提取所述增強圖像的紋理特征和邊緣特征;
將所述紋理特征和邊緣特征構造為同質性特征,根據所述同質性特征將所述增強圖像映射到同質性空間,得到特征圖像;
利用文本區域檢測器從所述特征圖像中提取文本區域;
從所述增強圖像的所述文本區域中提取和識別字符。
上述的方法,其中,所述對原始圖像進行灰度級的非線性動態壓縮包括:
利用均衡化變換函數對所述原始圖像的灰度級進行均衡化變換,并構造均衡化變換后的灰度直方圖;
利用單調遞增式S型函數對所述灰度直方圖中的灰度級進行非線性動態壓縮。
上述的方法,其中,所述均衡化變換函數為:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國移動通信集團廣東有限公司,未經中國移動通信集團廣東有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200910241565.8/2.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





