[發明專利]印刷體阿拉伯字符預處理方法和裝置有效
| 申請號: | 201010530207.1 | 申請日: | 2010-11-03 |
| 公開(公告)號: | CN102456138A | 公開(公告)日: | 2012-05-16 |
| 發明(設計)人: | 王琛;劉正珍;鈕興昱 | 申請(專利權)人: | 漢王科技股份有限公司 |
| 主分類號: | G06K9/36 | 分類號: | G06K9/36;G06T7/60 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100193 北京*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 印刷體 阿拉伯 字符 預處理 方法 裝置 | ||
?
技術領域
本發明屬于光學字符識別領域,涉及一種字符預處理方法和裝置,具體涉及一種印刷體阿拉伯字符預處理方法和裝置。
?
背景技術
在字符識別時,需要從原圖中對字符圖像進行定位,然后再根據定位的坐標進行單字符識別。在印刷體的阿拉伯文中,各詞語在基線處連接在一起,排版時為了使每行中的文字都保持完整,在該行中一些詞中的拉長符的長度經常會比較長。如圖1所示,如果一個字符帶著較長的拉長符,但該字符的形狀則不可避免地存在一定的變形,導致字符不容易識別,現有的方法一般首先通過切分先將拉長符斷開,然后分別對得到的切分塊進行識別,但切分時所采取的切分點會影響識別的效果,而且在切分點選取得并不非常準確的情況下,阿拉伯字符間的拉長符難免會對字符的識別帶來影響。
?
發明內容
本發明所要解決的技術問題是公開了一種印刷體阿拉伯字符預處理方法和裝置,在進行字符識別前通過重心分析選取置信框,并通過置信框對字符圖像進行調整后識別,避免了拉長符在阿拉伯文中的影響,提高了字符識別的識別率。
本發明公開了一種印刷體阿拉伯字符預處理方法,包括如下步驟:
步驟一:對切分后得到的字符圖像分別進行重心分析,計算字符圖像的重心偏離度;如果字符圖像的重心偏離度小于指定閾值,則轉到步驟三,否則轉到步驟二;
步驟二:根據得到的重心偏離度調整置信框,確定置信框內的字符圖像;
步驟三:將置信框內的字符圖像加載到識別核心進行識別。
所述步驟一包括如下步驟:
步驟1.1?對切分后得到的字符圖像進行垂直投影;
步驟1.2?根據垂直投影得到的直方圖進行統計,分別標記字符圖像的重心、左重心和右重心;
步驟1.3?根據標記的重心、左重心和右重心計算字符圖像的重心偏離度;
步驟1.4?將重心偏離度與指定閾值比較;如果字符圖像的重心偏離度小于指定閾值,則轉到步驟三,否則轉到步驟二。
所述重心為字符圖像的水平重心,在該重心的水平坐標的左側的垂直投影值之和與右側的垂直投影值之和相等。
所述左重心為字符圖像的左邊界到重心之間水平方向上的某一點,該點到字符圖像的左邊界的水平坐標的垂直投影值之和與從該點到重心的垂直投影值之和相等。
所述右重心為重心到字符圖像的右邊界之間水平方向上的某一點,該點到字符圖像的右邊界的水平坐標的垂直投影值之和與從該點到重心的垂直投影值之和相等。
所述重心偏離度的計算公式為,其中,字符圖像對應的重心為,左重心為,右重心為,幾何中心為。
所述步驟二包括如下步驟:
步驟2.1根據重心偏離度確定字符圖像中待調整部分;
步驟2.2根據得到的待調整部分進行輪廓分析,得到調整點;
步驟2.3?根據輪廓分析得到的調整點進行置信框調整。
所述確定字符圖像中待調整部分時,選取使字符圖像的左右兩端的投影值差值最小的坐標點作為調整后字符圖像的幾何中心,根據字符圖像的幾何中心定位待調整部分。
所述待調整部分進行輪廓分析時,分別判斷字符圖像中待調整部分對應的上輪廓和下輪廓的差值是否在輪廓閾值之內,如果在輪廓閾值之內,則從字符圖像的邊界開始查找首個上輪廓或下輪廓的差值在輪廓閾值之外的點作為調整點。
所述上輪廓為字符圖像中每列像素從上至下第一個黑像素的位置,下輪廓為字符圖像中每列像素從下往上第一個黑像素的位置。
所述根據輪廓分析得到的調整點進行置信框調整時,如果調整的是字符圖像的左邊部分時,則將置信框的左邊界右移至調整點;如果調整的是字符圖像的右邊部分,則將置信框的右邊界左移至調整點。
本發明還公開了一種印刷體阿拉伯字符預處理裝置,包括如下模塊:
分析模塊:對切分后得到的字符圖像分別進行重心分析,計算字符圖像的重心偏離度;如果字符圖像的重心偏離度小于指定閾值,則轉到加載模塊,否則轉到調整模塊;
調整模塊:根據得到的重心偏離度調整置信框,確定置信框內的字符圖像;
加載模塊:將置信框內的字符圖像加載到識別核心進行識別。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于漢王科技股份有限公司,未經漢王科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010530207.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:架空輸電線路異物清除裝置
- 下一篇:一種高壓電纜異物清除裝置





