[發明專利]印刷體阿拉伯字符預處理方法和裝置有效
| 申請號: | 201010530207.1 | 申請日: | 2010-11-03 |
| 公開(公告)號: | CN102456138A | 公開(公告)日: | 2012-05-16 |
| 發明(設計)人: | 王琛;劉正珍;鈕興昱 | 申請(專利權)人: | 漢王科技股份有限公司 |
| 主分類號: | G06K9/36 | 分類號: | G06K9/36;G06T7/60 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100193 北京*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 印刷體 阿拉伯 字符 預處理 方法 裝置 | ||
1.一種印刷體阿拉伯字符預處理方法,其特征在于,包括如下步驟:
步驟一:對切分后得到的字符圖像分別進行重心分析,計算字符圖像的重心偏離度;如果字符圖像的重心偏離度小于指定閾值,則轉到步驟三,否則轉到步驟二;
步驟二:根據得到的重心偏離度調整置信框,確定置信框內的字符圖像;
步驟三:將置信框內的字符圖像加載到識別核心進行識別。
2.根據權利要求1所述的方法,其特征在于:所述步驟一包括如下步驟:
步驟1.1?對切分后得到的字符圖像進行垂直投影;
步驟1.2?根據垂直投影得到的直方圖進行統計,分別標記字符圖像的重心、左重心和右重心;
步驟1.3?根據標記的重心、左重心和右重心計算字符圖像的重心偏離度;
步驟1.4?將重心偏離度與指定閾值比較;如果字符圖像的重心偏離度小于指定閾值,則轉到步驟三,否則轉到步驟二。
3.根據權利要求2所述的方法,其特征在于:所述重心為字符圖像的水平重心,在該重心的水平坐標的左側的垂直投影值之和與右側的垂直投影值之和相等。
4.根據權利要求3所述的方法,其特征在于:所述左重心為字符圖像的左邊界到重心之間水平方向上的某一點,該點到字符圖像的左邊界的垂直投影值之和與從該點到重心的垂直投影值之和相等。
5.根據權利要求3所述的方法,其特征在于:所述右重心為重心到字符圖像的右邊界之間水平方向上的某一點,該點到字符圖像的右邊界的垂直投影值之和與從該點到重心的垂直投影值之和相等。
6.根據權利要求2所述的方法,其特征在于:所述重心偏離度的計算公式為,其中,字符圖像對應的重心為,左重心為,右重心為,幾何中心為。
7.根據權利要求1所述的方法,其特征在于:所述步驟二包括如下步驟:
步驟2.1根據重心偏離度確定字符圖像中待調整部分;
步驟2.2根據得到的待調整部分進行輪廓分析,得到調整點;
步驟2.3?根據輪廓分析得到的調整點進行置信框調整。
8.根據權利要求7所述的方法,其特征在于:所述確定字符圖像中待調整部分時,選取使字符圖像的左右兩端的投影值差值最小的坐標點作為調整后字符圖像的幾何中心,根據字符圖像的幾何中心定位待調整部分。
9.根據權利要求7所述的方法,其特征在于:所述待調整部分進行輪廓分析時,分別判斷字符圖像中待調整部分對應的上輪廓和下輪廓的差值是否在輪廓閾值之內,如果在輪廓閾值之內,則從字符圖像的邊界開始查找首個上輪廓或下輪廓的差值在輪廓閾值之外的點作為調整點。
10.根據權利要求9所述的方法,其特征在于:所述上輪廓為字符圖像中每列像素從上至下第一個黑像素的位置,下輪廓為字符圖像中每列像素從下往上第一個黑像素的位置。
11.根據權利要求7所述的方法,其特征在于:所述根據輪廓分析得到的調整點進行置信框調整時,如果調整的是字符圖像的左邊部分時,則將置信框的左邊界右移至調整點;如果調整的是字符圖像的右邊部分,則將置信框的右邊界左移至調整點。
12.一種印刷體阿拉伯字符預處理裝置,其特征在于,包括如下模塊:
分析模塊:對切分后得到的字符圖像分別進行重心分析,計算字符圖像的重心偏離度;如果字符圖像的重心偏離度小于指定閾值,則轉到加載模塊,否則轉到調整模塊;
調整模塊:根據得到的重心偏離度調整置信框,確定置信框內的字符圖像;
加載模塊:將置信框內的字符圖像加載到識別核心進行識別。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于漢王科技股份有限公司,未經漢王科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010530207.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:架空輸電線路異物清除裝置
- 下一篇:一種高壓電纜異物清除裝置





