[發明專利]一種基于圖像投影變換的文本圖像糾偏方法在審
| 申請號: | 201910355195.4 | 申請日: | 2019-04-29 |
| 公開(公告)號: | CN110097054A | 公開(公告)日: | 2019-08-06 |
| 發明(設計)人: | 段強;李銳;于治樓;王相成;宗云兵 | 申請(專利權)人: | 濟南浪潮高新科技投資發展有限公司 |
| 主分類號: | G06K9/32 | 分類號: | G06K9/32 |
| 代理公司: | 濟南信達專利事務所有限公司 37100 | 代理人: | 姜明 |
| 地址: | 250100 山東省濟南市*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文本圖像 圖像投影變換 糾偏 偏轉 投影變換 邊框 計算投影矩陣 最小外接矩形 圖像二值化 角度旋轉 人工處理 輸入圖像 圖像識別 文本區域 文字方向 硬件支持 自動處理 閾值檢測 計算量 寬高比 原圖像 自適應 坐標點 角點 條邊 排版 圖像 場景 | ||
本發明特別涉及一種基于圖像投影變換的文本圖像糾偏方法。該基于圖像投影變換的文本圖像糾偏方法,首先通過圖像二值化后對含文本區域的四條邊框的提取獲得四個坐標點,根據給定寬高比選擇一條邊作為標準邊并計算出規范矩形的四個角點的坐標,計算投影矩陣對原圖像進行投影變換;使用OpenCV生成最小外接矩形和偏轉角度;然后根據偏轉角度旋轉圖像使文字方向變為水平方向。該基于圖像投影變換的文本圖像糾偏方法,使用自適應閾值檢測和投影變換自動處理輸入圖像,計算量較小,不需要強大硬件支持,不僅能得到穩定且可靠的結果,對于規范排版的文本圖像場景有較強通用性,同時還省去了人工處理的流程,提高了圖像識別效率和處理能力。
技術領域
本發明涉及OCR圖像識別技術領域,特別涉及一種基于圖像投影變換的文本圖像糾偏方法。
背景技術
在人工智能發展的浪潮當中,將重復且機械的工作用機器替代人類是一個必然的趨勢。在目前已有的人工智能應用中,文字識別已經非常成熟,而且不僅限于打印字體的識別,還包括手寫體的識別。但是如果想做到更加智能化、自動化,在文字識別之前,還要有一步圖像的規范化,如找出文字的正確方向,以保證后續文本框標注、文字分隔、文字識別等一系列步驟的可靠性和準確度。
目前主流的OCR((Optical Character Recognition,光學字符識別)識別算法和框架中,對圖像的文字方向要求比較高,通常上要求文字方向水平。因此在傳統的OCR應用中,往往通過人為規定圖片的輸入格式和方向對圖像進行規范,并設置標準框和手動旋轉按鈕以方便調節。但是,這樣做需要耗費人力且不適用于大批量的文字識別場景,不適用于目前大數據發展的自動化的趨勢。
給定一幅包含規范排版文字的圖像,由于照片拍攝的視角差異,可能會導致矩形的證件、票據等變形為不規則的四邊形,且方向偏轉,不利于OCR的識別。例如,火車票的常規寬高比約為1.574,但攝像頭拍攝的圖像和文字會發生變形。此時,傳統的OCR應用識別火車票圖像時就會發生文字識別錯誤。
基于此,本發明提出了一種基于圖像投影變換的文本圖像糾偏方法。用于給定寬高比的OCR圖像識別的預處理部分,目的是消除照片的拍攝視角差異導致的圖片形狀不規則和圖片方向偏轉。
發明內容
本發明為了彌補現有技術的缺陷,提供了一種簡單高效的基于圖像投影變換的文本圖像糾偏方法。
本發明是通過如下技術方案實現的:
一種基于圖像投影變換的文本圖像糾偏方法,其特征在于,包括以下步驟:
(1)首先通過自適應的閾值獲得原始圖像的二值化圖像;
(2)通過圖像二值化后對含文本區域的四條邊框的提取獲得四個坐標點,根據給定寬高比選擇一條邊作為標準邊并計算出規范矩形的四個角點的坐標,計算投影矩陣對原圖像進行投影變換(projective transformation);
(3)使用OpenCV的MinAreaRect函數生成最小外接矩形,并以此獲得該矩形的偏轉角度;
(4)然后根據計算得到的偏轉角度旋轉圖像使文字方向變為水平方向。
所述步驟(1)中,使用OpenCV的adaptiveThreshold函數根據圖像某個區域的圖像明暗變化自動設置的閾值將圖像二值化。
所述步驟(2)中,獲取二值化后圖像中文字排版的四個方向的邊緣所在的直線,根據四條直線延長線相交所圍成的不規則四邊形,得到投影變換前的ROI((region ofinterest,感興趣區域)。
通過邊緣檢測或者霍夫變換(Hough transformation)找到圖像中文字排版的四個方向的邊緣所在的直線。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于濟南浪潮高新科技投資發展有限公司,未經濟南浪潮高新科技投資發展有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910355195.4/2.html,轉載請聲明來源鉆瓜專利網。





