[發(fā)明專利]OCR圖像預處理與文字識別在審
| 申請?zhí)枺?/td> | 201810901494.9 | 申請日: | 2018-08-10 |
| 公開(公告)號: | CN110826360A | 公開(公告)日: | 2020-02-21 |
| 發(fā)明(設計)人: | 陳松宇;程晨 | 申請(專利權)人: | 南京寧融信網(wǎng)絡科技有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/34;G06T7/13 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 210000 江*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | ocr 圖像 預處理 文字 識別 | ||
本發(fā)明涉及一種計算機技術,主要利用圖像處理的方法來解決OCR文字識別率低下問題,屬于計算機技術、圖像處理技術應用領域。在掃描圖片后,當需要提取圖像中的文字時候,我們就需要用到文字識別。而當文字識別的時候,圖片沒有處理時候他的效率是底下的。這里使用圖像預處理然后識別的方法。首先對圖像進行的灰度化二值化,拉普拉斯銳化,對稱均值濾波,圖片水平拉伸,圖片細化,設置抗鋸齒的屬性,最后對圖像進行OCR文字識別。
技術領域
本發(fā)明涉及一種計算機技術,主要利用圖像處理的方法來解決OCR文字識別率低下問題,屬于計算機技術、圖像處理技術應用領域。
背景技術
伴隨在掃描圖片后,當需要提取圖像中的文字時候,我們就需要用到文字識別,而當文字識別的時候,圖片沒有處理時候他的效率是底下的,這里使用圖像預處理然后識別的方法,首先對圖像進行的灰度化二值化,拉普拉斯銳化,對稱均值濾波,圖片水平拉伸,圖片細化,設置抗鋸齒的屬性,最后對圖像進行OCR文字識別;
但是使用該方法進行文字識別時仍然存在一定的偏差,較圖片未處理之前提升識別率接近一倍。
發(fā)明內(nèi)容
本發(fā)明的目的是克服了現(xiàn)有OCR技術的不足而提供了一種圖片先行預處理再識別的提取圖像文字方法;
為了解決上述存在的技術問題,本發(fā)明采用下列技術方案:
圖片沒有處理時候他的效率是底下的,這里使用圖像預處理然后識別的方法,首先對圖像進行的灰度化二值化,拉普拉斯銳化,對稱均值濾波,圖片水平拉伸,圖片細化,設置抗鋸齒的屬性,最后對圖像進行OCR文字識別;
其中具體步驟為:
圖像二值化:將圖像上的像素點的灰度值設置為0或255,圖像的二值化使圖像中數(shù)據(jù)量大為減少,從而能凸顯出目標的輪廓;
圖像拉普拉斯銳化:圖像增強中,平滑是為了消除圖像中噪聲的干擾,或者降低對比度,與之相反,有時為了強調圖像的邊緣和細節(jié),需要對圖像進行銳化,提高對比度,拉普拉斯銳化圖像是根據(jù)圖像某個像素的周圍像素到此像素的突變程度有關,也就是說它的依據(jù)是圖像像素的變化程度,運用拉普拉斯銳化可以增強圖像的細節(jié),找到圖像的邊緣;
圖像對稱均值濾波:對稱均值濾波的核心思想是,在一個局部范圍內(nèi),通過幾對對稱點像素的比較,獲得相對區(qū)域及不同區(qū)域的差別,然后將均值計算在所判定的同一個區(qū)域內(nèi)進行,這樣可以使邊界的保持更加靈活的同時又降低計算,設一個(2N+1)*(2N+1)的模板,則有2N*(2N+1)個對稱點,2N*(2N+1)個選擇點的像素均值代替原像素值;
圖片水平拉伸:對圖片進行水平方向的拉伸,防止?jié)h字壓縮模糊,使OCR識別效率提高;
圖片文字細化:漢字筆畫繁多,各個筆畫之間容易重疊,使用細化算法提取漢子骨架,細化是從原來的圖中去掉一些點,但仍要保持原來的形狀,實際上是保持原圖的骨架,判斷一個點是否能去掉是以8個相鄰點(八連通)的情況來作為判據(jù)的,具體判據(jù)為:內(nèi)部點不能刪除,鼓勵點不能刪除,直線端點不能刪除,如果P是邊界點,去掉P后,如果連通分量不增加,則P可刪除;
如圖11的那些點,第一個點不能去除,因為它是內(nèi)部點,第二個點不能去除,它也是內(nèi)部點,第三個點不能去除,刪除后會使原來相連的部分斷開,第四個點可以去除,這個點不是骨架,第五個點不可以去除,它是直線的端點,第六個點不可以去除,它是直線的端點,對于所有的這樣的點,我們可以做出一張表,來判斷這樣的點能不能刪除;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京寧融信網(wǎng)絡科技有限公司,未經(jīng)南京寧融信網(wǎng)絡科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810901494.9/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種工件清洗方法
- 下一篇:一種新型高密度ITO靶材制備方法
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





