[發明專利]文檔圖像壓縮方法及其在文檔認證中的應用有效
| 申請號: | 201310740957.5 | 申請日: | 2013-12-27 |
| 公開(公告)號: | CN103914858A | 公開(公告)日: | 2014-07-09 |
| 發明(設計)人: | 田宜彬;明偉 | 申請(專利權)人: | 柯尼卡美能達美國研究所有限公司 |
| 主分類號: | G06T9/00 | 分類號: | G06T9/00 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 陳煒;李德山 |
| 地址: | 美國加利*** | 國省代碼: | 美國;US |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文檔 圖像 壓縮 方法 及其 認證 中的 應用 | ||
1.一種用于對表示包含文本區域的文檔的二值圖像進行壓縮的方法,所述方法包括:
(a)將所述文本區域分割為多個符號圖像,每個符號圖像表示文本的符號,每個符號圖像以具有位置和大小的邊界框來界定;
(b)將在步驟(a)中所獲得的每個符號圖像分類為多個類別之一,每個類別由模板圖像和類別索引來表示,對于所分類的每個符號圖像,步驟(b)包括:
(b1)將所述符號圖像與每個模板圖像進行比較以確定它們是否彼此匹配,包括將所述符號圖像的多個特征與所述模板圖像的相應多個特征進行比較,所述多個特征包括密度統計特征、側面輪廓特征、拓撲統計特征及形狀特征;
(b2)如果在步驟(b1)中找到匹配,則與所分類的符號圖像相關聯地記錄與所匹配的模板對應的類別索引;以及
(b3)如果在步驟(b1)中沒有找到匹配,則通過使用所分類的符號圖像的圖像作為新類別的模板圖像并為所述新類別分配類別索引,來將所述新類別添加到所述多個類別,并且與所分類的符號圖像相關聯地記錄所述類別索引;
(c)將每個類別的模板圖像的大小調整為最終大小;以及
(d)將所述多個類別中的每個類別的經大小調整后的模板圖像連同其類別索引、在步驟(a)中所獲得的每個符號圖像的邊界框的位置和大小、以及在步驟(b2)或(b3)中所獲得的每個符號圖像的類別索引存儲為壓縮的圖像數據。
2.根據權利要求1所述的方法,其中,步驟(a)包括:將所述文本區域分割為多個行,將所述多個行分割為多個詞,以及將所述多個詞分割為所述多個符號圖像。
3.根據權利要求1所述的方法,其中,所述密度統計特征包括分區輪廓特征,其中,所述形狀特征包括低階矩特征,以及
其中,對于所比較的每個模板圖像,步驟(b1)包括:
計算第一差別數量、第二差別數量、第三差別數量和第四差別數量,所述第一差別數量、第二差別數量、第三差別數量和第四差別數量分別表示所述符號圖像的、與所述模板圖像的相應特征不同的分區輪廓特征的數量、側面輪廓特征的數量、拓撲統計特征的數量和低階矩特征的數量;以及
其中,如果所述第一差別數量小于或等于第一閾值,所述第二差別數量小于或等于第二閾值,所述第三差別數量小于或等于第三閾值,以及所述第四差別數量小于或等于第四閾值,則確定所述符號圖像和所述模板圖像彼此匹配。
4.根據權利要求1所述的方法,其中,所述密度統計特征包括分區輪廓特征,其中,所述形狀特征包括低階矩特征,以及
其中,對于每個所比較的模板圖像,步驟(b1)包括:
計算第一差別數量、第二差別數量、第三差別數量和第四差別數量,所述第一差別數量、第二差別數量、第三差別數量和第四差別數量分別表示所述符號圖像的、與所述模板圖像的相應特征不同的分區輪廓特征的數量、側面輪廓特征的數量、拓撲統計特征的數量和低階矩特征的數量;以及
其中,如果所述第一差別數量至所述第四差別數量的和小于或等于閾值,則確定所述符號圖像和所述模板圖像彼此匹配。
5.根據權利要求1所述的方法,在步驟(b)之后以及在步驟(c)之前還包括如下步驟:
如果在步驟(b)中被分類為第一類別的符號圖像的總數低于閾值并且所述第一類別的分類置信度的度量低于另一閾值,則將所述多個類別中的所述第一類別合并到所述多個類別中的第二類別中。
6.根據權利要求1所述的方法,其中,在步驟(c)中,至少一些模板圖像的最終大小是彼此不同的,其中,步驟(c)包括:
(c1)計算每個模板圖像與每個其它模板圖像的相似度度量;
(c2)基于算出的與其它模板圖像的相似度度量,確定每個模板圖像的最終大小;以及
(c3)將每個模板圖像的大小調整為在步驟(c2)中所確定的最終大小。
7.根據權利要求6所述的方法,其中,對于每對模板圖像,步驟(c1)包括:
計算第一差別數量、第二差別數量、第三差別數量和第四差別數量,所述第一差別數量、第二差別數量、第三差別數量和第四差別數量分別表示該對模板圖像的彼此不同的分區輪廓特征的數量、側面輪廓特征的數量、拓撲統計特征的數量和低階矩特征的數量;以及
對所述第一差別數量至所述第四差別數量求和作為所述相似度度量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于柯尼卡美能達美國研究所有限公司,未經柯尼卡美能達美國研究所有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310740957.5/1.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





