[發明專利]一種水印圖像OCR識別方法及其系統在審
| 申請號: | 201810025351.6 | 申請日: | 2018-01-09 |
| 公開(公告)號: | CN108229460A | 公開(公告)日: | 2018-06-29 |
| 發明(設計)人: | 歐陽永中 | 申請(專利權)人: | 佛山科學技術學院 |
| 主分類號: | G06K9/20 | 分類號: | G06K9/20;G06K9/32;G06K9/38;G06T1/00;G06T5/00 |
| 代理公司: | 廣州嘉權專利商標事務所有限公司 44205 | 代理人: | 梁嘉琦 |
| 地址: | 528000 廣東省佛山市*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 水印標識 水印 二值化處理 水印圖像 圖像 灰度處理 獲取圖像 區域對應 銳化處理 統一處理 原始圖像 整體圖像 坐標矯正 合并 標定 灰度 去除 銳化 圖案 統一 圖片 | ||
本發明公開了一種水印圖像OCR識別方法及其系統,包括以下步驟,對圖像進行坐標矯正;獲取圖像的水印標識;標定水印標識部分區域對應坐標;提取包含水印標識部分的區域;圖片去除含有水印標識部分的區域;對含水印標識部分的區域進行灰度處理;對含水印標識部分的區域進行USM銳化處理;對含水印標識部分的區域進行二值化處理;將二值化處理后的水印標識部分的區域根據坐標合并到原始圖像上;執行OCR識別。本發明通過將水印部分的圖案提出進行灰度、銳化、二值化處理后合并到原圖中統一進行OCR識別,由于僅僅對水印部分區域的圖像進行處理,不會因為統一處理導致整體圖像識別困難,凸顯出水印部分的文字,能有效提高對水印部分文字的識別準確性。
技術領域
本發明涉及圖像識別領域,特別是一種水印OCR識別方法及其系統。
背景技術
帶水印的圖片,就是在文字的上面添加上一層半透明的圖像,這層圖像不會影響讀者對于文字的閱讀。OCR文字識別,指利用OCR(Optical Character Recognition,光學字符識別)技術,將圖片、照片上的文字內容,直接轉換為可編輯文本的軟件。軟件可以把圖片轉換成可以編輯的文字。支持JPG、PNG、GIF、BMP、DOC等圖片格式。但是目前的OCR識別方法均不能識別出帶有水印圖片上面的文字。
發明內容
為解決上述問題,本發明的目的在于提供一種能夠識別出包括水印圖像上文字的一種水印OCR識別方法及其系統。
本發明解決其問題所采用的技術方案是:
一種水印圖像OCR識別方法,包括以下步驟:
對圖像進行坐標矯正,建立坐標模型;
獲取圖像的水印標識,在圖像上標出包含有水印標識部分的區域;
標定水印標識部分區域對應坐標;
提取包含水印標識部分的區域;
圖片去除含有水印標識部分的區域;
對含水印標識部分的區域進行灰度處理;
對含水印標識部分的區域進行USM銳化處理;對含水印標識部分的區域進行二值化處理;
將二值化處理后的水印標識部分的區域根據坐標合并到原始圖像上,形成待處理圖像;
對待處理圖像執行OCR識別。
進一步,所述灰度處理為對含水印標識部分的區域圖像中每一像素的RGB值進行映射,映射到0至255的灰度值。
進一步,所述二值化處理包括以下步驟:
橫向掃描含水印標識部分的區域圖像,把兩邊為淺色、中間為深色的所有點的灰度值累加,累加的總灰度值為sum1,同時累計點數p1;
縱向掃描含水印標識部分的區域圖像,把上下兩邊為淺色、中間為深色的所有點的灰度值累加,累加的總灰度值為sum2,同時累計點數p2;
二值化的閾值為(sum1+sum2)/(p1+P2),若當前像素灰度大于等于閾值,則輸出黑色像素塊,若當前像素灰度小于閾值,則輸出白色像素塊。
進一步,對OCR識別的文字進行自動矯正處理,包括以下步驟:
調用并運行word拼寫檢測與糾正插件;
輸出OCR識別后的文字,進行自動糾正;
輸出自動糾正后的文字。
一種水印圖像OCR識別系統,包括:
糾正裝置,對圖像進行坐標矯正,建立坐標模型;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于佛山科學技術學院,未經佛山科學技術學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810025351.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種目標跟蹤方法
- 下一篇:一種基于深度學習的隧道裂縫快速識別方法





