[發(fā)明專利]文字圖像處理方法及裝置在審
| 申請(qǐng)?zhí)枺?/td> | 201710823748.5 | 申請(qǐng)日: | 2017-09-13 |
| 公開(公告)號(hào): | CN107609558A | 公開(公告)日: | 2018-01-19 |
| 發(fā)明(設(shè)計(jì))人: | 奚智 | 申請(qǐng)(專利權(quán))人: | 北京元心科技有限公司 |
| 主分類號(hào): | G06K9/34 | 分類號(hào): | G06K9/34;G06K9/46;G06T7/11;G06T7/13;G06T7/136;G06T7/194 |
| 代理公司: | 北京金闕華進(jìn)專利事務(wù)所(普通合伙)11224 | 代理人: | 陳建春 |
| 地址: | 100176 北京市大興區(qū)北京經(jīng)濟(jì)*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 文字 圖像 處理 方法 裝置 | ||
技術(shù)領(lǐng)域
本申請(qǐng)涉及印刷或書寫字符識(shí)別領(lǐng)域,尤其涉及文字圖像處理方法及裝置。
背景技術(shù)
隨著數(shù)碼相機(jī)、攝像頭、掃描儀等圖像獲取設(shè)備的廣泛使用,圖像中信息越來越引起人們的關(guān)注,圖像漸漸成為信息交流的主體。光學(xué)字符識(shí)別(OCR)技術(shù)應(yīng)運(yùn)而生,通過這種技術(shù),設(shè)備可以將圖像中的文字信息識(shí)別出來。
在現(xiàn)有技術(shù)中,圖像二值化(或?qū)ふ议撝?通常是OCR系統(tǒng)的第一步,它將灰度圖像轉(zhuǎn)換成分別表示文本和背景的二元形式,OCR的識(shí)別率主要基于二值圖像的質(zhì)量。然而,對(duì)于對(duì)比度差或復(fù)雜背景的文本圖像來說,很難找到適當(dāng)?shù)拈撝祵⑽谋九c背景分開。雖然在過去多年已經(jīng)提出了多種閾值選擇方法,但其質(zhì)量仍然限制了OCR的性能,無法進(jìn)行自適應(yīng)調(diào)節(jié),導(dǎo)致現(xiàn)有的圖像文字識(shí)別方法精度較低,無法滿足實(shí)際應(yīng)用的需求。
針對(duì)文字圖像的邊緣提取技術(shù)有基于數(shù)學(xué)形態(tài)學(xué)、基于變換域和基于梯度算子等的方法。其中基于梯度算子的方法,如Canny算子、Sobel算子,邊緣提取較連貫,細(xì)節(jié)保留好,但受文字圖像質(zhì)量影響,提取的邊緣常常包含偽邊緣。
發(fā)明內(nèi)容
為了克服現(xiàn)有技術(shù)中存在的不足,本發(fā)明要解決的技術(shù)問題是提供一種文字圖像處理方法及裝置,其能夠提高文字圖像的質(zhì)量,進(jìn)而提高文字識(shí)別的準(zhǔn)確率和識(shí)別速度。
為解決上述技術(shù)問題,本發(fā)明的文字圖像處理方法,包括:
將文字圖像的灰度圖像均勻劃分為多個(gè)矩形網(wǎng)格部分;
針對(duì)每一網(wǎng)格部分,計(jì)算直方圖并對(duì)直方圖進(jìn)行均衡化處理;
通過相鄰網(wǎng)格部分直方圖的插值對(duì)整個(gè)圖像進(jìn)行均衡化處理,得到均衡化的圖像。
作為本發(fā)明所述方法的改進(jìn),針對(duì)每一網(wǎng)格部分,還進(jìn)行下述處理:確定基于直方圖的二值化閾值;根據(jù)直方圖和二值化閾值,確定網(wǎng)格最大閾值和網(wǎng)格最小閾值;及所述方法還包括:結(jié)合相鄰網(wǎng)格部分的網(wǎng)格最大閾值和網(wǎng)格最小閾值,通過插值得到每個(gè)像素所在點(diǎn)的像素最大閾值和像素最小閾值;判斷均衡化的圖像的每一像素的灰度值是否在相應(yīng)的像素最大閾值和像素最小閾值之間,如果是則使灰度值等于255,如果否則使灰度值等于0,得到初步二值化圖像;根據(jù)初步二值化圖像的連通域在均衡化的圖像上對(duì)應(yīng)的像素進(jìn)行邊緣檢測(cè),得到標(biāo)記文字輪廓連通域的二值化圖像。
作為本發(fā)明所述方法的另一種改進(jìn),針對(duì)每一網(wǎng)格部分,還進(jìn)行下述處理:
計(jì)算直方圖的各像素的灰度值與確定的二值化閾值之間的絕對(duì)平均差;
響應(yīng)于所述絕對(duì)平均差小于預(yù)定閾值,從鄰近網(wǎng)格部分的二值化閾值插值得到該網(wǎng)格部分的計(jì)算的二值化閾值;
將計(jì)算的二值化閾值用于確定網(wǎng)格最大閾值和網(wǎng)格最小閾值。
作為本發(fā)明所述方法的又一種改進(jìn),所述方法還包括:對(duì)所述初步二值化圖像進(jìn)行邊緣噪聲清理和/或孤立點(diǎn)消除。
作為本發(fā)明所述方法的再一種改進(jìn),所述方法還包括:對(duì)標(biāo)記文字輪廓連通域的二值化圖像進(jìn)行過濾和膨脹處理,得到文字區(qū)域;對(duì)均衡化的圖像的文字區(qū)域進(jìn)行二值化處理,得到二值化的文字圖像;對(duì)所述文字圖像進(jìn)行噪聲過濾;將所述文字圖像分割成多個(gè)單個(gè)字符的圖像。
作為本發(fā)明所述方法的另一種改進(jìn),所述方法還包括:對(duì)文字圖像進(jìn)行校正預(yù)處理和/或去噪聲預(yù)處理。
為解決上述技術(shù)問題,本發(fā)明的文字圖像處理裝置,包括:
劃分模塊,用于將文字圖像的灰度圖像均勻劃分為多個(gè)矩形網(wǎng)格部分;
網(wǎng)格處理模塊,用于針對(duì)每一網(wǎng)格部分,計(jì)算直方圖并對(duì)直方圖進(jìn)行均衡化處理;
整體均衡化模塊,用于通過相鄰網(wǎng)格部分直方圖的插值對(duì)整個(gè)圖像進(jìn)行均衡化處理,得到均衡化的圖像。
作為本發(fā)明所述裝置的改進(jìn),所述網(wǎng)格處理模塊還用于針對(duì)每一網(wǎng)格部分進(jìn)行下述處理:確定基于直方圖的二值化閾值;根據(jù)直方圖和二值化閾值,確定網(wǎng)格最大閾值和網(wǎng)格最小閾值;所述裝置還包括:像素閾值計(jì)算模塊,用于結(jié)合相鄰網(wǎng)格部分的網(wǎng)格最大閾值和網(wǎng)格最小閾值,通過插值得到每個(gè)像素所在點(diǎn)的像素最大閾值和像素最小閾值;初步二值化圖像生成模塊,用于判斷均衡化的圖像的每一像素的灰度值是否在相應(yīng)的像素最大閾值和像素最小閾值之間,如果是則使灰度值等于255,如果否則使灰度值等于0,得到初步二值化圖像;邊緣檢測(cè)模塊,用于根據(jù)初步二值化圖像的連通域在均衡化的圖像上對(duì)應(yīng)的像素進(jìn)行邊緣檢測(cè),得到標(biāo)記文字輪廓連通域的二值化圖像。
作為本發(fā)明所述裝置的另一種改進(jìn),所述網(wǎng)格處理模塊還用于針對(duì)每一網(wǎng)格部分進(jìn)行下述處理:
計(jì)算直方圖的各像素的灰度值與確定的二值化閾值之間的絕對(duì)平均差;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京元心科技有限公司,未經(jīng)北京元心科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710823748.5/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 一種數(shù)據(jù)庫讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





