[發明專利]維哈柯文文本圖像的行提取方法及裝置無效
| 申請號: | 201010605775.3 | 申請日: | 2010-12-23 |
| 公開(公告)號: | CN102542279A | 公開(公告)日: | 2012-07-04 |
| 發明(設計)人: | 李洪峰 | 申請(專利權)人: | 漢王科技股份有限公司 |
| 主分類號: | G06K9/48 | 分類號: | G06K9/48;G06K9/72 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100193 北京*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 維哈柯文 文本 圖像 提取 方法 裝置 | ||
1.一種維哈柯文文本圖像的行提取方法,其特征在于,包括:
將維哈柯文文本圖像劃分成至少兩個圖像段,分別獲得每個圖像段的水平投影直方圖;
利用所述水平投影直方圖對所述圖像段進行粗切分,獲得粗切分行,并在所述粗切分行中包括窄行和/或沒有粗切分開的行時,對所述窄行和/或沒有粗切分開的行進行細切分,得到圖像段的行切分結果;
根據所述圖像段的行切分結果獲得所述維哈柯文文本圖像的行切分結果。
2.根據權利要求1所述的方法,其特征在于,所述分別獲得每個圖像段的水平投影直方圖包括:
對所述圖像段進行水平方向上的投影,獲得所述圖像段中每個像素行的黑色像素點的個數;
根據所述像素行的相對高度和所述像素行的黑色像素點的個數,獲得所述圖像段的水平投影直方圖。
3.根據權利要求1所述的方法,其特征在于,所述利用所述水平投影直方圖對所述圖像段進行粗切分,獲得粗切分行包括:
根據所述水平投影直方圖獲取所述圖像段中各像素行的水平投影均值;
根據所述水平投影均值設置粗切分閾值;
利用所述粗切分閾值和所述水平投影直方圖進行行切分,獲得粗切分行。
4.根據權利要求1或3所述的方法,其特征在于,還包括:
確定所述粗切分行中包括的文字行的行數以及文字行的平均行高,并根據所述平均行高確定第一行高閾值和第二行高閾值;
如果所述粗切分行對應的最大水平投影值小于預設投影值閾值且所述粗切分行的行高小于所述第一行高閾值時,所述粗切分行為窄行;
在所述水平投影直方圖中,根據粗切分行中包括的文字行的行數進行判斷,對于包含兩個以上文字行的粗切分行,如果所述包含兩個以上文字行的粗切分行中的第一較大波峰到第二較大波峰之間的距離大于所述第二行高閾值,則所述包含兩個以上文字行的粗切分行為沒有粗切分開的行;
其中所述第一行高閾值=平均行高/2,所述第二行高閾值=3*平均行高/4,所述預設投影閾值=n/4,其中所述n表示當前處理的圖像段的寬度。
5.根據權利要求1所述的方法,其特征在于,所述對所述窄行和/或沒有粗切分開的行進行細切分包括:
對于窄行,若所述窄行與到所述窄行中心的距離最近的主行合并后的行高小于第三行高閾值,則將所述窄行合并到所述主行;否則將所述窄行作為一行新的文本行;其中,所述第三行高閾值=3*平均行高/2;
對于所述沒有粗切分開的行,則在所述粗切分行中第一較大波峰和第二較大波峰之間水平投影值最小值對應的位置將所述沒有粗切分開的行進行切分。
6.根據權利要求1所述的方法,其特征在于,所述根據所述圖像段的行切分結果獲得所述維哈柯文文本圖像的行切分結果包括:
分別將當前圖像段中當前行的行中心與上一圖像段每行的行中心之間的距離進行比較,如果所述當前行的行中心與所述上一圖像段中的待合并行之間的距離小于預設閾值,則將所述當前行合并到所述待合并行;否則,確定所述上一段圖像中與所述當前行的行中心距離最近的文字行,并將所述當前行作為新的一行插入到與所述當前行的行中心距離最近的文字行的下方。
7.一種維哈柯文文本圖像的行提取裝置,其特征在于,包括:
圖像劃分單元,用于將維哈柯文文本圖像劃分成至少兩個圖像段,分別獲得每個圖像段的水平投影直方圖;
行切分單元,用于利用所述水平投影直方圖對所述圖像段進行粗切分,獲得粗切分行,并在所述粗切分行中包括窄行和/或沒有粗切分開的行時,對所述窄行和/或沒有粗切分開的行進行細切分,得到圖像段的行切分結果;?
行處理單元,用于根據所述圖像段的行切分結果獲得所述維哈柯文文本圖像的行切分結果。
8.根據權利要求7所述的裝置,其特征在于,所述圖像劃分單元包括:
圖像分段模塊,用于將維哈柯文文本圖像劃分成至少兩個圖像段;
水平投影直方圖獲取模塊,用于對所述圖像段進行水平方向上的投影,獲得所述圖像段中每個像素行的黑色像素點的個數,并根據所述像素行的相對高度和所述像素行的黑色像素點的個數,獲得所述圖像段的水平投影直方圖。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于漢王科技股份有限公司,未經漢王科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010605775.3/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:骨料計量控制裝置和骨料計量控制方法
- 下一篇:一種聚氨酯薄膜專用樹脂的配方
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





