[發(fā)明專利]一種適用于文本文檔的生成式圖像壓縮方法及裝置有效
| 申請?zhí)枺?/td> | 201910059573.4 | 申請日: | 2019-01-22 |
| 公開(公告)號: | CN109783776B | 公開(公告)日: | 2023-04-07 |
| 發(fā)明(設計)人: | 劉丹;陳亞軍;王少康 | 申請(專利權(quán))人: | 北京數(shù)科網(wǎng)維技術(shù)有限責任公司 |
| 主分類號: | G06F40/151 | 分類號: | G06F40/151;G06T11/00;G06T9/00;G06F17/16 |
| 代理公司: | 北京冠和權(quán)律師事務所 11399 | 代理人: | 朱健;張國香 |
| 地址: | 100000 北京市海*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 適用于 文本 文檔 生成 圖像 壓縮 方法 裝置 | ||
本發(fā)明涉及信息處理領域,尤其涉及一種適用于文本文檔的生成式圖像壓縮方法及裝置。包括如下步驟:(1)將文本文檔轉(zhuǎn)換為RGB位圖;(2)根據(jù)文本文檔特征來預構(gòu)建顏色表;(3)對RGB位圖進行映射索引,使用每個像素RGB值與顏色表進行映射,在顏色表中尋找最接近的顏色值,確定對應的索引色,并記錄索引號,組成索引色圖像;(4)按LZW或其他數(shù)據(jù)壓縮算法對圖像數(shù)據(jù)區(qū)進行壓縮,形成最后的圖像文件。通過本發(fā)明的圖像壓縮方法,適應性的對文件公文進行合理的濾波、去噪、盡可能在圖片掃描和壓縮過程中保留原始文字和顏色信息,去噪簡單速度快,文件轉(zhuǎn)換算法易于編程,比較適用于公文文檔類像素顏色復雜度不高的文件存儲工作。
技術(shù)領域
本發(fā)明涉及信息處理領域,尤其涉及一種適用于文本文檔的生成式圖像壓縮方法及裝置。
背景技術(shù)
隨著信息技術(shù)的發(fā)展,歷史遺存了大量的紙質(zhì)公文檔案需要進行數(shù)字化,常見的方式是以掃描圖像的形態(tài)來保存;同時電子公文作為一個嚴肅內(nèi)容載體,其展現(xiàn)形態(tài)有其固定的格式,采用圖像格式作為公文文檔的載體進行信息公開及共享,在便利性及準確性方面可以取得較好的平衡。
目前的圖像壓縮算法并未針對公文類圖像進行優(yōu)化,本發(fā)明描述的一種生成式圖像壓縮方法,適用于文本文檔產(chǎn)生的圖像文件,可在保持原有顯示效果的基礎上,有效壓縮圖像文件體積,有利于文件的共享利用。
公文是黨政軍和企事業(yè)單位機關(guān)實施領導、履行職能、處理公務的具有特定效力和規(guī)范體式的文書,是傳達貫徹方針政策,公布法規(guī)和規(guī)章,指導、布置和商洽工作,請示和答復問題,報告、通報和交流情況等的重要工具。公文以及類似文檔有以下特征:
(1)內(nèi)容主要是文字和圖表,較少出現(xiàn)彩色圖片;
(2)文檔整體顏色域簡單,只有少數(shù)幾種顏色取值;
我們稱之為為文書類文檔。
相當多的文書類文檔有公開發(fā)布的需求,公開發(fā)布使用何種格式作為文本文檔載體是一個重要課題,許多研究和方案集中于如何盡可能減少對閱讀終端的環(huán)境需求,即不要求文檔的閱讀終端具備特定的硬件和軟件。圖像是一種被廣泛支持的電子文件格式,大多數(shù)的終端如PC、移動終端、手機等有豐富的軟件支持圖像格式,甚至連各類終端上的網(wǎng)頁瀏覽器和PDF閱讀器也支持圖像格式,因此選用圖像作為文檔發(fā)布的承載格式或格式核心,對閱讀終端的要求可被降低到最小。文檔轉(zhuǎn)換為圖像發(fā)布解決了受眾終端閱讀的問題,但仍需要在此基礎上提出優(yōu)化方案,強化其優(yōu)點,有效彌補其短板。
相同內(nèi)容的圖像與文本文件相比,其體積增加數(shù)倍甚至數(shù)十倍,因此,盡量壓縮待發(fā)布圖像文件的體積成為圖像發(fā)布方案的重要組成部分。本發(fā)明描述的一種圖像壓縮方法,適用于文書文檔產(chǎn)生的圖像文件,可在原有基礎上有效壓縮圖像文件體積。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種適用于文本文檔的生成式圖像壓縮方法。
本發(fā)明的目的還在于提供一種適用于文本文檔的生成式圖像壓縮裝置。
本發(fā)明的目的可實現(xiàn)的方式是:
一種適用于文本文檔的生成式圖像壓縮方法,包括如下步驟:
(1)將文本文檔轉(zhuǎn)換為RGB位圖;
(2)根據(jù)文本文檔特征來預構(gòu)建顏色表;
(3)對RGB位圖進行映射索引,使用每個像素RGB值與顏色表進行映射,在顏色表中尋找最接近的顏色值,確定對應的索引色,并記錄索引號,組成索引色圖像;
(4)按LZW或其他數(shù)據(jù)壓縮算法對圖像數(shù)據(jù)區(qū)進行壓縮,形成最后的圖像文件。
所述的將文本文檔轉(zhuǎn)換為RGB位圖包括:
根據(jù)文本文檔的掃描圖像YUV參數(shù)構(gòu)建RGB位圖;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京數(shù)科網(wǎng)維技術(shù)有限責任公司,未經(jīng)北京數(shù)科網(wǎng)維技術(shù)有限責任公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910059573.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





