[發明專利]基于能量最小化框架的文檔圖像傾斜度檢測與糾正方法有效
| 申請號: | 201310321375.3 | 申請日: | 2013-07-22 |
| 公開(公告)號: | CN103400130A | 公開(公告)日: | 2013-11-20 |
| 發明(設計)人: | 鄔向前;卜巍;唐有寶 | 申請(專利權)人: | 哈爾濱工業大學 |
| 主分類號: | G06K9/32 | 分類號: | G06K9/32 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 150001 黑龍江省哈爾濱市南崗區*** | 國省代碼: | 黑龍江;23 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 能量 最小化 框架 文檔 圖像 傾斜度 檢測 糾正 方法 | ||
技術領域
本發明涉及文檔分析與應用領域,具體涉及一種基于能量最小化框架的文檔圖像傾斜度檢測與糾正方法。
背景技術
隨著數字化技術的不斷發展,電子文檔的出現在人們日常生活中變得越來越流行,比如使用相機或掃描儀來記錄管理日志,存儲歷史文件等。相對紙質文檔,電子文檔具有方便性,永久性等優勢。在獲取或采集電子文檔圖像時,發生一定的傾斜是不可避免。然而,大部分文檔系統(例如光學字符識別,文檔頁面布局分析等)對文檔圖像的傾斜度是敏感的。因此,傾斜度檢測和糾正在文檔圖像分析與應用領域中變成一個重要的問題。為了糾正傾斜度,在數字化過程中,文檔對齊預處理操作是必要的。
文檔圖像可以分為兩種:手寫文檔圖像和機打文檔圖像。當在一個不受約束的條件下書寫文本時,從手寫文檔圖像中檢測傾斜度是一個相對困難的任務。相對手寫文檔圖像,機打文檔圖像通常是規則排列的而且內容具有多樣性(文字,表格,圖像等等)。盡管目前已有大量科研人員在研究機打文檔圖像的傾斜度檢測和糾正方法,但是它仍然是一個具有挑戰性的問題。
發明內容
基于以上不足之處,本發明提出了一種基于能量最小化框架的文檔圖像傾斜度檢測和糾正方法,該方法的研究對象為機打文檔圖像,文檔圖像中的內容可以是文字、表格、圖片等。本發明首先需要使用掃描儀將文檔掃描成電子文檔圖像,然后估算前景像素狀態信息,然后利用前景像素狀態信息構建能量函數,然后利用圖像處理技術和直線擬合技術計算初始的傾斜度,最后進行能量最小化過程得到最終的傾斜度并將文檔圖像進行糾正。
該方法包括三個過程,具體如下:
(1)計算前景像素狀態信息
在計算前景像素狀態信息之前,首先對掃描得到的文檔圖像進行二值化,用黑色表示前景,白色表示背景像素,給定一個前二值文檔圖像I之后,前景像素的狀態計算過程如下:一個邊界框定義為一個文檔圖像的邊界,用P記作整個前景像素的集合,(W,H)記作文檔圖像I的大小,那么對每一個前景像素p∈P,它的狀態信息為sp=(xp,yp,wp,hp),其中xp,yp,wp,hp分別為p到圖像最左、最上、最右和最下邊的距離;
(2)利用直線擬合技術估算初始傾斜度
接下來利用文檔圖像中最外圍的前景像素的狀態信息來估算初始傾斜度,一個邊界框有四個邊:上、下、左和右,對每一邊都能得到其最外圍的前景像素狀態信息子集,用以下方式得到上邊最外圍前景像素狀態信息子集,記為
yi∈si∩yi=min{yp|yp∈sp∩xp∈sp∩xp=i}.
將TS中每個元素的xp做為x坐標,yp作為y坐標畫圖,圖中下面的點擬合成一條直線,邊界框剩下的三邊都經過該處理,將使用直線擬合的技術來估算文檔圖像的初始傾斜度,在直線擬合之前先對TP進行采樣,用如下方式將TP劃分為N個互不重疊的部分STSi:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于哈爾濱工業大學,未經哈爾濱工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310321375.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種用于安裝數控刀架安裝鉆頭的裝置
- 下一篇:電機殼立式鑄造模具





