[發明專利]一種OCR漏識判斷方法及系統無效
| 申請號: | 201110446365.3 | 申請日: | 2011-12-28 |
| 公開(公告)號: | CN102592121A | 公開(公告)日: | 2012-07-18 |
| 發明(設計)人: | 蘭榮春 | 申請(專利權)人: | 方正國際軟件有限公司 |
| 主分類號: | G06K9/20 | 分類號: | G06K9/20 |
| 代理公司: | 北京天悅專利代理事務所(普通合伙) 11311 | 代理人: | 田明;任曉航 |
| 地址: | 215123 江蘇省蘇州市工*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 ocr 判斷 方法 系統 | ||
技術領域
本發明涉及計算機文字識別處理技術領域,尤其涉及一種基于圖像區域增長算法的OCR漏識判斷方法及系統。
背景技術
隨著計算機技術及數字化技術的不斷發展,需要將傳統的紙質書籍、文檔、報紙等電子化。在將這些物理實體數據到電子數據的轉換加工過程中,紙質的書籍、文檔、報紙最終轉換為電子數據(TXT、WORD,PDF等格式的電子文件),不可避免的使用文字識別技術(OCR技術,Optical?Character?Recognition,光學字符識別)。
基于圖書數字化加工的特點,要求有效圖像內容不能“丟失”,現在的有很多OCR引擎,如漢王,ABBYY,文通等。這些OCR技術雖然已經比較成熟,但在應用過程中并不能完全滿足實際的需求,特別是OCR的漏識問題。
OCR漏識的原因主要是:
1.被識別文檔本身的原因,如印刷的油墨問題,或者被識別文檔年代久遠或破損,字跡模糊不清晰等;
2.掃描文檔時存在的問題,如掃描的質量,圖像的分辨率等,容易造成文字筆畫不規則,為后續的正確識別造成障礙;
3.OCR技術本身給出的文字坐標不能將整個文字包圍,也會造成漏識。
OCR漏識后,就會造成了頁面有效內容的丟失,現在采用通過識別后的文字與原圖人工對比查找漏識區的方法,效率低。
因此,在OCR識別過程中,OCR識別圖像的正確性與效率固然重要,但如何找到OCR的漏識區間也是非常重要的。目前還未見針對OCR識別中的漏識問題提出的技術解決方案及相關文獻。
發明內容
針對現有技術中所存在的不足,本發明的目的在于提供一種能夠快速找到OCR過程中的漏識區間的基于圖像區域增長算法的OCR漏識判斷方法及系統。
為實現上述發明目的,本發明采用的技術方案如下:
一種OCR漏識判斷方法,包括以下步驟:
(1)數據輸入:輸入原始圖像,所述的原始圖像為二值圖;
(2)對輸入的原始圖像進行OCR識別,輸出識別結果;
(3)漏識判斷:根據步驟(2)中的輸出識別結果,判斷漏識區間;
(4)搜索漏識區間里的聯通區,過濾圖像與噪點;
(5)輸出漏識文字。
進一步,步驟(2)中所述的輸出識別結果包括識別出的文字及其矩形坐標即矩形框。
進一步,步驟(3)中,判斷漏識區間的方法如下:對輸出的文字逐個處理,判斷文字筆畫是否全部在矩形框內,如果不是,則根據輸出的該文字的矩形坐標從矩形四邊向外做圖像增長,將與矩形框相鄰的黑點也視作該文字的像素點,得到該文字的所有像素點,從圖像中刪除該文字的所有像素點;如果是,則繼續處理下一個文字,直到完成所有文字的處理,最后就得到了圖像中的漏識區間。
更進一步,在對文字的矩形框作增長時,具體方法是:從矩形框邊緣開始,遇與文字連接有效像素點的就向外擴邊,直到無有效像素點為止,這就得到了該文字新的邊界。
再進一步,在對文字矩形框向外增長時,按像素點逐點向外增長,增長的比例控制在50%以內。
進一步,步驟(4)中,搜索聯通區時,對步驟(3)中得到的所有漏識區間中的黑色像素點周圍進行掃描,得到所有聯通區;
然后根據聯通區面積及文字矩形框面積的大小,將聯通區面積遠大于文字矩形框面積的區域視作圖像,將聯通區面積遠小于文字矩形框面積的區域視作噪點,然后對這些圖像與噪點進行過濾。
更進一步,將大于文字矩形框面積4-8倍以上的聯通區視作圖像。將小于文字矩形框面積1/8-1/16以下的聯通區視作噪點。
進一步,步驟(5)中,將接近于文字矩形框面積的聯通區域視作漏識文字進行輸出。
一種OCR漏識判斷系統,包括以下裝置:
數據輸入裝置,用于輸入原始圖像,所述的原始圖像為二值圖;
OCR識別裝置,用于對輸入的原始圖像進行OCR識別,輸出識別結果,所述識別結果包括識別出的文字及其矩形坐標即矩形框;
漏識判斷裝置,用于對輸出的文字逐個處理,判斷文字筆畫是否全部在矩形框內,如果不是,則根據輸出的該文字的矩形坐標從矩形四邊向外做圖像增長,將與矩形框相鄰的黑點也視作該文字的像素點,得到該文字的所有像素點,從圖像中刪除該文字的所有像素點;如果是,則繼續處理下一個文字,直到完成所有文字的處理,最后就得到了圖像中的漏識區間;
聯通區搜索裝置,用于搜索漏識區間里的聯通區;
圖像與噪點過濾裝置,用于過濾漏識區間里的圖像與噪點;
輸出裝置,用于輸出漏識文字。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于方正國際軟件有限公司,未經方正國際軟件有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110446365.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種手機及其分格顯示屏
- 下一篇:觸摸式立體感應開關與觸摸式立體感應控制面板





