[發明專利]文字檢測方法及系統有效
| 申請號: | 201610091568.8 | 申請日: | 2016-02-18 |
| 公開(公告)號: | CN107093172B | 公開(公告)日: | 2020-03-17 |
| 發明(設計)人: | 徐昆;郭曉威;黃飛躍;鄭宇飛;張惜今;盧藝帆 | 申請(專利權)人: | 清華大學;騰訊科技(深圳)有限公司 |
| 主分類號: | G06T7/00 | 分類號: | G06T7/00;G06T7/90 |
| 代理公司: | 北京派特恩知識產權代理有限公司 11270 | 代理人: | 張振偉;張穎玲 |
| 地址: | 100084*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文字 檢測 方法 系統 | ||
本發明公開了一種文字檢測方法及系統;方法包括:將目標圖像的三色通道中的每個圖像進行減色處理,得到減色圖像,以及,將目標圖像轉換為二值圖像;將減色圖像中具有相同色彩的連通塊進行合并,以及將二值圖像中具有相同色彩的連通塊合并;對減色圖像三色通道的每種色彩通道的連通塊、以及二值圖像中的連通塊,分別在豎直和水平方向上以連接的方式進行合并,得到目標圖像中候選的文字區域;在目標圖像上對應候選的文字區域的位置提取特定區域,基于所提取的特定區域中包含文字區域的概率與預設概率閾值的比較結果判斷提取的特定區域中是否包含文字行或文字列。實施本發明,能夠對圖像中的文本進行準確檢測。
技術領域
本發明涉及圖像中的文字檢測技術,尤其涉及一種文字檢測方法及系統。
背景技術
文檔圖像即圖像格式的文檔,它是通過某種方式(如掃描)將紙質文檔等轉化為圖像格式的文檔,以供用戶電子閱讀,文檔圖像的典型示例是便攜式文檔格式(PDF,PortableDocument Format)格式圖像、以及DjVu格式圖像。
目前的文字檢測技術可以對文檔圖像中的文字進行檢測(定位圖像中承載文字的區域),并基于檢測到的承載文字的區域進行文字識別。
一般意義上的圖像不僅包括文檔圖像,還包括非文檔圖像(也就是通過掃描格式圖像如網絡相冊中的用戶上傳圖像,這些圖像可能是聯合照片專家組(JPG)圖像、位圖(BMP)圖像、標簽圖像文件格式(TIFF)圖像、圖形交換格式(GIF)圖像以及可交換的圖像文件格式(EXIF)圖像等。
如果能識別非文檔格式圖像中的文字,則可以獲得準確的語義信息,幫助用戶檢索、管理圖像。要想識別非掃描格式圖像中的文字,檢測圖像中的文字是必要的前置步驟,目前的文字檢測技術多使用人工指定的特征來判別圖像是否中是否包含有文字,且多針對英文字符進行檢測,由于中文與英文在字形結構上存在顯著的差異,應用于文檔圖像中的中文檢測時住準確度與文檔圖像中檢測英文的精度存在較大差異,難以滿足實際應用的需求。
發明內容
本發明實施例提供一種文字檢測方法及系統,能夠對圖像中的文本進行準確檢測。
本發明實施例的技術方案是這樣實現的:。
第一方面,本發明實施例提供一種文字檢測方法,所述方法包括:
將目標圖像的三色通道中的每個圖像進行減色處理,得到減色圖像,以及,將所述目標圖像轉換為二值圖像;
將所述減色圖像中具有相同色彩的連通塊進行合并,以及將所述二值圖像中具有相同色彩的連通塊合并;
對所述減色圖像三色通道的每種色彩通道的連通塊、以及所述二值圖像中的連通塊,分別在豎直和水平方向上以連接的方式進行合并,得到所述目標圖像中候選的文字區域;
在所述目標圖像上對應所述候選的文字區域的位置提取特定區域,基于所提取的所述特定區域中包含文字區域的概率與預設概率閾值的比較結果判斷所述提取的特定區域中是否包含文字行或文字列。
優選地,所述將目標圖像的三色通道中的每個圖像進行減色處理,得到減色圖像,包括:
將所述目標圖像的紅綠藍三色通道中每個通道分別做K個等級的量化得到K個等級的區間;
將所述目標圖像中每個像素在RGB三色通道的亮度映射到對應通道量化的區間中,K為整數且255>K>1。
優選地,所述將減色圖像中具有相同色彩的連通塊進行合并,以及將所述二值圖像中具有相同色彩的連通塊合并,包括:
對所述減色圖像中以及所述二值圖像中的每個像素作為一個單獨的連通塊,建立針對所述像素的并查集執行以下處理:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于清華大學;騰訊科技(深圳)有限公司,未經清華大學;騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610091568.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種磨液回收裝置
- 下一篇:一種圖像霧霾濃度的估計方法





