[發明專利]一種基于圖像投影變換的文本圖像糾偏方法在審
| 申請號: | 201910355195.4 | 申請日: | 2019-04-29 |
| 公開(公告)號: | CN110097054A | 公開(公告)日: | 2019-08-06 |
| 發明(設計)人: | 段強;李銳;于治樓;王相成;宗云兵 | 申請(專利權)人: | 濟南浪潮高新科技投資發展有限公司 |
| 主分類號: | G06K9/32 | 分類號: | G06K9/32 |
| 代理公司: | 濟南信達專利事務所有限公司 37100 | 代理人: | 姜明 |
| 地址: | 250100 山東省濟南市*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文本圖像 圖像投影變換 糾偏 偏轉 投影變換 邊框 計算投影矩陣 最小外接矩形 圖像二值化 角度旋轉 人工處理 輸入圖像 圖像識別 文本區域 文字方向 硬件支持 自動處理 閾值檢測 計算量 寬高比 原圖像 自適應 坐標點 角點 條邊 排版 圖像 場景 | ||
1.一種基于圖像投影變換的文本圖像糾偏方法,其特征在于,包括以下步驟:
(1)首先通過自適應的閾值獲得原始圖像的二值化圖像;
(2)通過圖像二值化后對含文本區域的四條邊框的提取獲得四個坐標點,根據給定寬高比選擇一條邊作為標準邊并計算出規范矩形的四個角點的坐標,計算投影矩陣對原圖像進行投影變換;
(3)使用OpenCV的MinAreaRect函數生成最小外接矩形,并以此獲得該矩形的偏轉角度;
(4)然后根據計算得到的偏轉角度旋轉圖像使文字方向變為水平方向。
2.根據權利要求1所述的基于圖像投影變換的文本圖像糾偏方法,其特征在于:所述步驟(1)中,使用OpenCV的adaptiveThreshold函數根據圖像某個區域的圖像明暗變化自動設置的閾值將圖像二值化。
3.根據權利要求1所述的基于圖像投影變換的文本圖像糾偏方法,其特征在于:所述步驟(2)中,獲取二值化后圖像中文字排版的四個方向的邊緣所在的直線,根據四條直線延長線相交所圍成的不規則四邊形,得到投影變換前的ROI。
4.根據權利要求3所述的基于圖像投影變換的文本圖像糾偏方法,其特征在于:通過邊緣檢測或者霍夫變換找到圖像中文字排版的四個方向的邊緣所在的直線。
5.根據權利要求1所述的基于圖像投影變換的文本圖像糾偏方法,其特征在于:所述步驟(2)中,當獲得或者選定了一條標準邊后,根據給定的寬高比繪制出一個標準的矩形,所述標準矩形的四個角點作為投影變換的目標位置。
6.根據權利要求1所述的基于圖像投影變換的文本圖像糾偏方法,其特征在于:所述步驟(2)中,得到不規則四邊形四個角點的坐標以及符合設定寬高比的標準矩形的四個角點的坐標后,通過投影變換得到一個3×3的投影矩陣,通過構建齊次矩陣并運用矩陣乘法即可將不規則的四邊形變為標準矩形。
7.根據權利要求1所述的基于圖像投影變換的文本圖像糾偏方法,其特征在于:所述步驟(3)中,使用OpenCV的minAreaRect函數生成包含文字區域的最小外接矩形,返回最小外接矩形的中心點,寬度,高度和偏轉角度。
8.根據權利要求1所述的基于圖像投影變換的文本圖像糾偏方法,其特征在于:所述步驟(4)中,將偏轉角度輸入get Rotation Matrix 2D函數,即可得到水平標準化的圖像。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于濟南浪潮高新科技投資發展有限公司,未經濟南浪潮高新科技投資發展有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910355195.4/1.html,轉載請聲明來源鉆瓜專利網。





