[發明專利]一種紙質文檔圖文信息采集與壓縮的方法和系統無效
| 申請號: | 200810132610.1 | 申請日: | 2008-07-07 |
| 公開(公告)號: | CN101625684A | 公開(公告)日: | 2010-01-13 |
| 發明(設計)人: | 劉為為;胡錦龍 | 申請(專利權)人: | 全國組織機構代碼管理中心 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 中國國際貿易促進委員會專利商標事務所 | 代理人: | 李 玲 |
| 地址: | 100029北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 紙質 文檔 圖文 信息 采集 壓縮 方法 系統 | ||
技術領域
本發明涉及圖文信息采集與壓縮技術,特別是指一種紙質文檔圖文信息采集與壓縮的方法和系統。
背景技術
奧運會等大型活動服務機構的電子檔案庫不僅包括組織機構代碼的文本信息,同時還配套有批準文件、許可證、法人身份證、營業執照、登記證等影印文件,這些文件是進一步識別和比對企事業單位身份的重要依據。通過紙質文件掃描、軟件壓縮可以將這些文件合并到電子檔案庫,為使用方提供更詳盡的信息支持。
奧運等大型活動的服務機構比較多,而且分散在不同的地方。為了集中收集這些檔案,需要為每一個服務機構能提供一個搜集、制作電子檔案文件的軟件。同時掃描的文件一般都比較大,在現有的網絡帶寬環境下傳輸會比較慢。
發明內容
有鑒于此,本發明提出一種紙質文檔圖文信息采集與壓縮的方法和系統,使電子文檔的制作、傳輸更加方便。
基于上述目的本發明提供的一種紙質文檔圖文信息采集與壓縮的方法,包括:
掃描文檔并將掃描得到的電子文檔保存為圖像格式;
將圖像格式的電子文檔轉換為專用圖像文件格式。
可選的,該方法所述專用圖像文件格式為二值電子文檔格式。
可選的,該方法所述專用圖像文件格式還包括:灰度格式、彩色格式中的一種或多種。
可選的,該方法所述二值電子文檔格式包括:文件頭數據塊、文件背景信息數據塊、文件安全訪問控制數據塊、文件尾數據塊、目錄信息數據塊、頁面索引數據塊、頁面圖像數據塊、附件數據塊、頁面附件元素描述數據塊、文件元數據塊。
可選的,該方法所述文件安全訪問控制數據塊包括:文件標識、加密方式、解密密碼、文件校驗碼、用戶權限;
所述目錄信息數據塊包括:目錄節點、目錄節點對應的頁碼;
所述頁索引數據塊包括:頁面總數、頁ID、頁面類型、頁順序碼、頁碼、頁數據偏移量。
可選的,該方法所述將圖像格式的電子文檔轉換為二值電子文檔格式還包括:對轉換后的文件進行加密。
可選的,該方法所述加密過程是按照字符排序進行混排加密。
可選的,該方法還包括轉換后二值電子文檔格式的電子文檔解壓流量的過程:
調用FreeFileBlocks,在內存中按照文件結構申請一個文件列表塊大小的內存空間,將這部分內存中釋放;
獲得待處理文件的大小,申請同等大小的內存,將整個文件讀入內存中,關閉該文件;
申請相應數據塊對象,按照文件結構從內存中讀取相應的數據塊對象;
按照文件存儲結構從內存中讀取相應的數據塊對象;
將讀取的數據塊加入塊列表;
調用數據塊對象的塊碰到虛函數;
根據文件安全訪問控制數據塊結構,查找安全控制數據塊解密;
定位頁面索引數據塊,定位頁面數據數據塊,綁定這兩個數據塊,得到加密數據塊個數;
為每個加密數據塊解密。
可選的,該方法所述掃描文檔并將掃描得到的電子文檔保存為圖像格式還包括:對圖像格式電子文檔調整為統一樣式的版面。
基于上述目的,本發明還提供了一種紙質文檔圖文信息采集與壓縮的系統,包括:
掃描模塊,用于將紙質文檔掃描為電子文檔;
格式壓縮模塊,用于將圖像格式的電子文檔轉換為專用圖像文件格式。
可選的,該系統所述專用圖像文件格式為二值電子文檔格式。
可選的,該系統所述專用圖像文件格式還包括:灰度格式、彩色格式中的一種或多種。
可選的,該系統所述二值電子文檔格式包括:文件頭數據塊、文件背景信息數據塊、文件安全訪問控制數據塊、文件尾數據塊、目錄信息數據塊、頁面索引數據塊、頁面圖像數據塊、附件數據塊、頁面附件元素描述數據塊、文件元數據塊。
可選的,該系統所述文件安全訪問控制數據塊包括:文件標識、加密方式、解密密碼、文件校驗碼、用戶權限;
所述目錄信息數據塊包括:目錄節點、目錄節點對應的頁碼;
所述頁索引數據塊包括:頁面總數、頁ID、頁面類型、頁順序碼、頁碼、頁數據偏移量。
可選的,該系統所述格式壓縮模塊還用于對轉換后的文件進行加密。
可選的,該系統所述加密是按照字符排序進行混排加密。
可選的,該系統還包括解壓瀏覽模塊,其中包括用于調用FreeFileBlocks,在內存中按照文件結構申請一個文件列表塊大小的內存空間,將這部分內存中釋放的子模塊;
獲得待處理文件的大小,申請同等大小的內存,將整個文件讀入內存中,關閉該文件的子模塊;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于全國組織機構代碼管理中心,未經全國組織機構代碼管理中心許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200810132610.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種利用可識別數字序列的投遞方法及系統
- 下一篇:高磅級偏心旋轉耐磨球閥
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置





