[發(fā)明專利]一種處理掃描書數(shù)據(jù)的方法及裝置有效
| 申請?zhí)枺?/td> | 201110448225.X | 申請日: | 2011-12-28 |
| 公開(公告)號: | CN103186911A | 公開(公告)日: | 2013-07-03 |
| 發(fā)明(設(shè)計)人: | 仇睿恒;李赟 | 申請(專利權(quán))人: | 北大方正集團有限公司;北京方正阿帕比技術(shù)有限公司 |
| 主分類號: | G06T11/60 | 分類號: | G06T11/60;G06K9/20 |
| 代理公司: | 北京同達信恒知識產(chǎn)權(quán)代理有限公司 11291 | 代理人: | 郭潤湘 |
| 地址: | 100871 北京市*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 處理 掃描 數(shù)據(jù) 方法 裝置 | ||
1.一種處理掃描書數(shù)據(jù)的方法,其特征在于,針對掃描書中的每個頁面文檔,包括:
讀取所述頁面文檔的頁面圖像數(shù)據(jù);
對所述頁面圖像數(shù)據(jù)進行分割、識別,得到所述頁面文檔中的每個文字在相應(yīng)頁面文檔上的矩形框位置和字符編碼;
對所述頁面文檔中的每行文字進行文字行聚合處理,得到所述每行文字的文字行信息,并根據(jù)所述文字行信息對所述每行文字中的每個文字對應(yīng)的矩形框進行修正,得到每個文字的確切圖像矩形框位置信息和文字行聚合信息;
存儲所述頁面文檔中每個文字對應(yīng)的確切圖像矩形框位置信息、文字行聚合信息和字符編碼。
2.如權(quán)利要求1所述的方法,其特征在于,根據(jù)相應(yīng)的文字行信息對所述每行文字中的每個文字的矩形框進行修正,具體包括:
根據(jù)所述文字行信息確定出所述每行文字對應(yīng)的行高;
將所述每行文字中的所有文字的矩形框的高度調(diào)整為與所述每行文字對應(yīng)的行高相同。
3.如權(quán)利要求2所述的方法,其特征在于,確定出所述每行文字對應(yīng)的行高之后,還包括:
根據(jù)所述每行文字的前一行文字和后一行文字的行高,對所述每行文字的行高進行修正。
4.如權(quán)利要求1所述的方法,其特征在于,根據(jù)相應(yīng)的文字行信息對所述每行文字中的每個文字的矩形框進行修正之后,還包括:
針對所述頁面文檔,根據(jù)所述頁面文檔中的文字的像素數(shù)據(jù),對所述頁面文檔中的所有文字進行分類,將視覺相同的文字歸為一類,從而得到多類文字圖像;
為每類文字圖像分配相應(yīng)的編號,并存儲該類文字圖像中每個文字圖像的確切圖像矩形框位置信息、字符編碼及對應(yīng)的編號;
將所述頁面文檔中的每類文字圖像刪除,并對刪除后的頁面文檔進行壓縮得到壓縮文檔,并存儲所述壓縮文檔。
5.如權(quán)利要求1所述的方法,其特征在于,根據(jù)相應(yīng)的文字行信息對所述掃描書中所有文字對應(yīng)的矩形框進行修正之后,還包括:
針對每本掃描書,根據(jù)所述每本掃描書的所有文字的像素數(shù)據(jù),對所述每本掃描書中的所有文字進行分類,將視覺相同的文字歸為一類,從而得到多類文字圖像;
為每類文字圖像分配相應(yīng)的編號,并存儲該類文字圖像中每個文字圖像的確切圖像矩形框位置信息、字符編碼及對應(yīng)的編號;
針對所述每本掃描書中的每個頁面文檔,將該頁面文檔中的文字圖像刪除,并對刪除后的頁面文檔進行壓縮得到壓縮文檔,并存儲所述壓縮文檔。
6.如權(quán)利要求1所述的方法,其特征在于,對所述頁面圖像數(shù)據(jù)進行分割、識別,具體包括:
采用光學(xué)字符識別OCR技術(shù)對所述頁面圖像數(shù)據(jù)進行分割和識別操作。
7.一種處理掃描書數(shù)據(jù)的裝置,其特征在于,包括:
頁面圖像數(shù)據(jù)讀取單元,用于讀取掃描書中的每個頁面文檔的頁面圖像數(shù)據(jù);
文字信息獲取單元,用于對所述頁面圖像數(shù)據(jù)讀取單元讀取得到的所述頁面文檔的頁面圖像數(shù)據(jù)進行分割、識別,得到所述頁面文檔中的每個文字在相應(yīng)頁面文檔上的矩形框位置和字符編碼;
文字修正單元,用于對所述頁面文檔中的每行文字進行文字行聚合處理,得到所述每行文字的文字行信息,并根據(jù)所述文字行信息對所述每行文字中的每個文字對應(yīng)的矩形框進行修正,得到每個文字的確切圖像矩形框位置信息和文字行聚合信息;
信息存儲單元,用于存儲所述頁面文檔中每個文字對應(yīng)的確切圖像矩形框位置信息、文字行聚合信息和字符編碼。
8.如權(quán)利要求7所述的裝置,其特征在于,所述文字修正單元根據(jù)相應(yīng)的文字行信息對所述每行文字中的每個文字的矩形框進行修正,具體用于:
根據(jù)所述文字行信息確定出所述每行文字對應(yīng)的行高;
將所述每行文字中的所有文字的矩形框的高度調(diào)整為與所述每行文字對應(yīng)的行高相同。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北大方正集團有限公司;北京方正阿帕比技術(shù)有限公司,未經(jīng)北大方正集團有限公司;北京方正阿帕比技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110448225.X/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種分體式汽車后橋殼組焊方法
- 下一篇:儲存器和其中使用儲存器的冷卻裝置
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





