[發明專利]電子文檔生成設備及電子文檔生成方法有效
| 申請號: | 200910006563.0 | 申請日: | 2009-02-19 |
| 公開(公告)號: | CN101515984A | 公開(公告)日: | 2009-08-26 |
| 發明(設計)人: | 梅田一郎;田中哲臣 | 申請(專利權)人: | 佳能株式會社 |
| 主分類號: | H04N1/387 | 分類號: | H04N1/387;G06K9/20 |
| 代理公司: | 北京怡豐知識產權代理有限公司 | 代理人: | 任之光;郭召道 |
| 地址: | 日本東京都*** | 國省代碼: | 日本;JP |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 電子 文檔 生成 設備 方法 | ||
技術領域
本發明總體上涉及由具有畸變的圖像生成可搜索電子文檔的電子文檔生成設備及電子文檔生成方法。
背景技術
已提出關于掃描圖像校正的多種常規方法。日本專利特開第S60-65668(1958)號公報公開了一種校正書本的裝訂部分中的彎曲畸變的方法。日本專利特開第2002-77578號公報公開了一種進行圖像校正的方法,該方法利用原稿上下兩端間的距離、攝像設備與原稿間的距離及攝像設備的相對位置,來校正由于拍攝對象表面高度的不均勻而產生的所拍攝圖像的畸變。
在日本專利特開第H7-93374(1995)號公報公開的技術中,對文檔圖像執行字符識別處理,并預先將作為字符識別結果的測試數據與示出文檔圖像上文本數據的相應位置的坐標信息相關聯。此外,在搜索文本時,顯示包含與所搜索文本相對應的部分的文檔圖像頁。另外,在日本專利特開第H8-63583(1996)號公報公開的技術中,預先將作為對文檔圖像執行字符識別處理的結果的文本數據,與分辨率降低了的文檔圖像相關聯,并寄存相關聯后的結果,從而使生成可搜索的文檔成為可能。
然而,在根據日本專利特開第S60-65668(1985)號公報與日本專利特開第2002-77578號公報的圖像校正方法中,在校正之后,由于畸變校正變換中的估計誤差所產生的校正誤差導致圖像中進一步產生畸變,這可能會進一步產生圖像質量劣化。也就是說,當執行畸變校正處理時,估計誤差等可能會產生進一步的畸變。因此,對用戶而言,畸變校正之后的圖像有可能比校正之前的圖像更難以識別。
另一方面,當對包含畸變的文檔圖像執行字符識別處理時,從文檔圖像中提取字符的準確度可能會降低。因此,整個文檔圖像的字符識別準確度可能會降低。
發明內容
根據本發明的一個實施例,提供一種電子文檔生成設備,該電子文檔生成設備具有:校正單元,用于校正第一圖像的畸變,以獲得校正圖像;字符識別單元,用于對包含在所述校正圖像中的多個字符圖像執行字符識別處理,以獲得文本數據;用于求出所述第一圖像中的各字符行的基線的單元;逆變換單元,用于對包含在所述校正圖像中的各字符圖像的位置坐標執行畸變校正逆變換,以求出所述第一圖像中的各字符圖像的位置坐標;用于基于由所述逆變換單元求出的所述第一圖像中的各字符圖像的所述位置坐標、就包含在所述第一圖像中的各字符圖像、求出該字符圖像相對于所述基線的相對位置的單元;以及生成單元,用于生成包含有所述文本數據及所述第一圖像的電子文檔,其中,所述文本數據的位置是基于相對于所述基線的所述相對位置而描述的。
通過下面結合附圖的對示例性實施例的說明,本發明的其他特征將變得更加清楚。
附圖說明
圖1是示出根據實施例1的電子文檔生成設備的示例的概要的框圖。
圖2是示出根據實施例1的電子文檔生成設備的示例的概要的系統圖。
圖3是示出電子文檔生成處理的實施例的框圖。
圖4是示出電子文檔生成處理的實施例的流程圖。
圖5A是示出輸入圖像的示例的一部分的圖。
圖5B是示出輸入圖像的示例的一部分的圖。
圖6A是示出通過旋轉輸入圖像而獲得的直立圖像的示例的一部分的圖。
圖6B是示出通過旋轉輸入圖像而獲得的直立圖像的示例的一部分的圖。
圖7A是示出通過對直立圖像進行畸變校正變換而獲得的畸變校正圖像的示例的一部分的圖。
圖7B是示出通過對直立圖像進行畸變校正變換而獲得的畸變校正圖像的示例的一部分的圖。
圖8A是示出畸變校正圖像中的基于測量誤差的畸變的示例的圖。
圖8B是示出畸變校正圖像中的基于測量誤差的畸變的示例的圖。
圖9A是示出畸變校正圖像上的文本區域的示例的圖。
圖9B是示出畸變校正圖像上的文本區域的示例的圖。
圖10A是示出從圖9A中所示出的文本區域中獲得的文本的示例的圖。
圖10B是示出從圖9B中所示出的文本區域中獲得的文本的示例的圖。
圖11A是示出圖6A中的區域601的放大圖。
圖11B是示出圖6B中的區域601的放大圖。
圖12A是示出圖11A中的區域1106的放大圖。
圖12B是示出圖11B中的區域1106的放大圖。
圖13A是示出設定基線及默認字符寬度的文本對象的PDF描述的示例的圖。
圖13B是示出設定基線及默認字符寬度的文本對象的PDF描述的示例的圖。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于佳能株式會社,未經佳能株式會社許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200910006563.0/2.html,轉載請聲明來源鉆瓜專利網。





