[發(fā)明專利]一種掃描版文檔重排版的方法有效
| 申請?zhí)枺?/td> | 201110302266.8 | 申請日: | 2011-10-09 |
| 公開(公告)號: | CN102890826A | 公開(公告)日: | 2013-01-23 |
| 發(fā)明(設計)人: | 安宇;王川 | 申請(專利權)人: | 北京多看科技有限公司 |
| 主分類號: | G06T11/60 | 分類號: | G06T11/60 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100029 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 掃描 文檔 排版 方法 | ||
技術領域
本發(fā)明涉及電子閱讀技術領域,尤其涉及一種掃描版文檔重排版的方法。
背景技術
在科學技術日新月異的今天,尤其是伴隨著互聯網技術的高速發(fā)展,人們的閱讀習慣不再只局限于傳統(tǒng)的紙質出版物閱讀,電子閱讀已經非常普及并且比重正在逐漸加大。由于電子閱讀設備(電子書、手機等)的便攜性,人們可以在生活中的碎片時間里進行電子閱讀,比如乘坐公交車、地鐵時,甚至在排隊買票的幾分鐘時間里也可以進行電子閱讀。
電子閱讀素材的來源多種多樣,有些來自電子出版物,有些來自紙質出版物的掃描版本。但是由于電子閱讀設備的便攜性,必然造成閱讀屏幕的尺寸受限。在當前各種電子閱讀設備的閱讀體驗中,對于掃描版文檔的閱讀非常不方便,如果將書頁大小尺寸的掃描圖片全部顯示在小尺寸屏幕中會覺得字太小,如果采用將掃描圖片局部放大的方式閱讀,由于一屏不能顯示完整的一行,閱讀一行文字就會產生放大區(qū)域的切換,閱讀一篇文章將會產生頻繁的翻頁。
發(fā)明內容
本發(fā)明的目的在于提出一種掃描版文檔重排版的方法,能夠將掃描版文檔根據電子閱讀設備的顯示器的尺寸進行重排版,方便用戶閱讀,提高用戶使用電子閱讀設備的感受度。
為達此目的,本發(fā)明采用以下技術方案:
一種掃描版文檔重排版的方法,包括以下步驟:
A、將掃描版文檔生成圖像,對生成的圖像進行采樣獲得待處理的彩色圖像;
B、將采樣獲得的彩色圖像轉化為二值圖;
C、對二值圖進行游程平滑;
D、對游程平滑處理后的二值圖求取連通域,把同值的且連通的一塊區(qū)域的外接矩形的位置記錄下來,作為初始塊位置信息;
E、將初始塊進行水平合并,得出文字的行信息和圖片位置;
F、將水平合并后的塊進行垂直合并,得出文字段落位置;
G、根據文字段落位置和圖片位置,對段落進行文字切分,首先在段落區(qū)域位置內進行水平投影,確定每行文字的位置,然后在一行的區(qū)域位置內進行垂直投影,確定每個文字的位置;
H、確定各段文字的閱讀順序;
I、根據文字段落位置、圖片位置和文字段落中文字的位置,將文字和圖片按照預先指定的全圖寬度和高度排版成新的圖像。
還包括以下步驟:
J、將排版后的新圖像放大或縮小至電子閱讀設備需要顯示的尺寸。
步驟A中,對生成的圖像進行采樣,采樣值采用矩陣fjk形式來表示,矩陣中的每一元素fjk取值如下:
fjk?=?f(X0+j*dX,Y0+k*dY),
其中,j為0到Mx–1的整數,k為0到My–1的整數,X0和Y0為初始坐標,dX和dY為步長,Mx和My分別為矩陣fjk的列數和行數,即在X、Y方向的采樣點數。
步驟B進一步包括以下步驟:
B1、將采樣獲得的彩色圖像轉化為灰度圖;
B2、采用全局自適應閾值方法將灰度圖轉換為二值圖。
步驟B1中,將采樣獲得的彩色圖像轉化為灰度圖采用以下公式:
Y=0.299*R+0.587*G+0.114*B,其中R、G和B分別為彩色圖像的紅色、綠色和藍色分量,Y為灰度值。
步驟B2中,如果灰度圖是白底黑字,則二值圖中文字部分所在像素取值為0,其余部分取值為1。
步驟B2中,還包括對二值圖進行矯正,進一步包括以下步驟:
采用側面投影的方法確定圖像的傾斜角度,
即采用f(x,y)表示白底黑字的二值圖,圖像外區(qū)域f(x,y)?=?1,二值圖Mx列、My行,當前的投影方向與X軸成θ角,
Sk=∑jf(Xj,Yk+Xj*tanθ),為一行的投影值,
若Sk等于Mx則取Sk=1,表示該行投影上無黑點,
若Sk小于Mx則取Sk=0,表示該行投影上有黑點,
Tθ=?∑kSk,表示θ角對應的全圖投影值,
在限定范圍內以預定步長變換θ值,Tθ值最大的角度就是圖像的傾斜角度;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京多看科技有限公司,未經北京多看科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110302266.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:洗碗機掉電處理電路及控制方法
- 下一篇:具分離裝置的干濕兩用吸塵器





