[發明專利]OCR圖像預處理與文字識別在審
| 申請號: | 201810901494.9 | 申請日: | 2018-08-10 |
| 公開(公告)號: | CN110826360A | 公開(公告)日: | 2020-02-21 |
| 發明(設計)人: | 陳松宇;程晨 | 申請(專利權)人: | 南京寧融信網絡科技有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/34;G06T7/13 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 210000 江*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | ocr 圖像 預處理 文字 識別 | ||
1.OCR 圖像預處理與文字識別方法,首先對圖像進行的灰度化二值化,拉普拉斯銳化,對稱均值濾波,圖片水平拉伸,圖片細化,設置抗鋸齒的屬性,最后對圖像進行OCR文字識別的步驟;其中:
圖像二值化:將圖像上的像素點的灰度值設置為0或255,圖像的二值化使圖像中數據量大為減少,從而能凸顯出目標的輪廓;
圖像拉普拉斯銳化:圖像增強中,平滑是為了消除圖像中噪聲的干擾,或者降低對比度,與之相反,有時為了強調圖像的邊緣和細節,需要對圖像進行銳化,提高對比度,拉普拉斯銳化圖像是根據圖像某個像素的周圍像素到此像素的突變程度有關,也就是說它的依據是圖像像素的變化程度,運用拉普拉斯銳化可以增強圖像的細節,找到圖像的邊緣;
圖像對稱均值濾波:對稱均值濾波的核心思想是,在一個局部范圍內,通過幾對對稱點像素的比較,獲得相對區域及不同區域的差別,然后將均值計算在所判定的同一個區域內進行,這樣可以使邊界的保持更加靈活的同時又降低計算;
圖片水平拉伸:對圖片進行水平方向的拉伸,防止漢字壓縮模糊,使OCR識別效率提高;
圖片文字細化:對圖片中的文字進行骨架的提取,把識別率提高。
2.根據權利要求1所述的OCR 圖像預處理與文字識別方法,其特征在于:圖像二值化中首先要把灰度圖像二值化,得到二值化圖像。
3.根據權利要求2所述的OCR 圖像預處理與文字識別方法,其特征在于:在圖像二值化后進行圖像拉普拉斯銳化,運用拉普拉斯可以增強圖像的細節,找到圖像的邊緣;但是有時候會把噪音也給增強了,那么可以在銳化前對圖像進行平滑處理;先看一階偏微分和推出的二元函數微分:
af/ay = f(x,y)-f(x, y-1)
一階微分法能夠用來檢測邊緣是否存在;
那么二階微分法,也就是拉普拉斯算子就可以確定邊緣的位置;
這樣可以找到一個模板矩陣:
此矩陣成為四鄰域也就是上面的二階微分法
此矩陣為八鄰域
從上面的兩種模板中就可以看出,如果一個黑色平面中有一個白點,那么模板矩陣可以使這個白點更亮;由于圖像邊緣就是灰度發生跳變的區域,所以拉普拉斯模板對邊緣檢測很有用,八鄰域的表示法為:
將算得的值替換原(x,y)處的像素值,可以得到類似邊界的地方,然后根據下式得到銳化圖像:
根據權利要求3所述的OCR 圖像預處理與文字識別方法,其特征在于:圖片拉普拉斯銳化后進行圖像對稱均值濾波,對稱均值濾波的核心思想是,在一個局部范圍內,通過幾對對稱點像素的比較,獲得相對區域及不同區域的差別,然后將均值計算在所判定的同一個區域內進行,這樣可以使邊界的保持更加靈活的同時又降低計算;
設一個(2N+1)*(2N+1)的模板,則有2N*(2N+1)個對稱點,2N*(2N+1)個選擇點的像素均值代替原像素值。
4.根據權利要求3所述的OCR 圖像預處理與文字識別方法,其特征在于:圖像對稱均值濾波后進行圖片水平拉伸,對圖片進行水平方向的拉伸,防止漢字壓縮模糊,使OCR識別效率提高。
5.根據權利要求4所述的OCR 圖像預處理與文字識別方法,其特征在于:圖片水平拉伸后進行圖片文字細化,漢字筆畫繁多,各個筆畫之間容易重疊,使用細化算法提取漢子骨架;細化是從原來的圖中去掉一些點,但仍要保持原來的形狀;實際上是保持原圖的骨架;判斷一個點是否能去掉是以8個相鄰點(八連通)的情況來作為判據的,具體判據為:內部點不能刪除,鼓勵點不能刪除,直線端點不能刪除,如果P是邊界點,去掉P后,如果連通分量不增加,則P可刪除。
6.根據權利要求5所述的OCR 圖像預處理與文字識別方法,其特征在于:圖片細化后對字體進行抗鋸齒渲染 ,可以使字體看起來會更清晰舒服,同樣OCR識別的效率也會提高,在圖標字體成為一種趨勢的今天,抗鋸齒渲染使用也越來越多。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京寧融信網絡科技有限公司,未經南京寧融信網絡科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810901494.9/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種工件清洗方法
- 下一篇:一種新型高密度ITO靶材制備方法
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





