[發明專利]處理方法及其裝置、打印控制方法和裝置有效
| 申請號: | 201611233168.2 | 申請日: | 2016-12-28 |
| 公開(公告)號: | CN106648481B | 公開(公告)日: | 2019-09-17 |
| 發明(設計)人: | 李磊;馬楊曉;熊丹 | 申請(專利權)人: | 珠海賽納打印科技股份有限公司 |
| 主分類號: | G06F3/12 | 分類號: | G06F3/12 |
| 代理公司: | 北京匯思誠業知識產權代理有限公司 11444 | 代理人: | 王剛;龔敏 |
| 地址: | 519060 廣東省珠海市*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 截取 方法和裝置 打印控制 修正處理 重疊文字 文檔 成像控制 自動識別 打印 修正 | ||
1.一種基于文檔截取部分的處理方法,其特征在于,包括:
獲取基于文檔依次截取的多個截取部分,每兩個相鄰的截取部分作為一個截取組合;
分別針對所有截取組合中的每個截取組合進行重疊文字修正處理;
在所述分別針對所有截取組合中的每個截取組合進行重疊文字修正處理的過程中,針對每個截取組合進行重疊文字修正處理包括:
判斷該截取組合中,在先截取部分與在后截取部分中是否存在重疊的文字部分,所述重疊的文字部分為在先截取部分的結束部分,所述重疊的文字部分為在后截取部分的起始部分;
若是,則將在先截取部分或者在后截取部分中所述重疊的文字部分刪除;
其中,在所述分別針對所有截取組合中的每個截取組合進行重疊文字修正處理的過程之前,還包括:
根據所述多個截取部分中的每個截取部分生成對應該截取部分的像素值分布圖,所述像素值分布圖的第一坐標用于表示截取部分的縱向位置,所述像素值分布圖的第二坐標用于表示截取部分中的像素值,根據空白區域將所述像素值分布圖在所述第一坐標的方向上分為多個像素區塊,每個像素區塊用于表示截取部分的縱向位置區間所對應的像素值,每兩個相鄰的像素區塊之間具有空白區域;
所述判斷該截取組合中,在先截取部分與在后截取部分中是否存在重疊的文字部分,所述重疊的文字部分為在先截取部分的結束部分,所述重疊的文字部分為在后截取部分的起始部分:若是,則將在先截取部分或者在后截取部分中重疊的文字部分刪除的過程包括:
判斷該截取組合中,在先截取部分對應的像素值分布圖與在后截取部分對應的像素值分布圖中是否存在重疊的像素區塊區域,所述重疊的像素區塊區域為在后截取部分對應的像素值分布圖的結束部分,所述重疊的像素區塊區域為在先截取部分對應的像素值分布圖的起始部分;
若是,則將在先截取部分或者在后截取部分中所述重疊的像素區塊區域所對應的文字部分刪除。
2.根據權利要求1所述的方法,其特征在于,
所述判斷該截取組合中,在先截取部分與在后截取部分中是否存在重疊的文字部分的過程包括:
判斷在先截取部分的最后一個字符是否與在后截取部分的至少一個字符相同;
若是,則確定在后截取部分中與在先截取部分的最后一個字符相同的字符為待確定字符;
所述待確定字符的數目為m個,m為大于或等于1的整數;
對于每個所述待確定字符,判斷是否存在i,使在先截取部分中由第i個字符至最后一個字符組成的字符串與在后截取部分中由第一個字符至該待確定字符組成字符串相同,i為大于或等于1的整數,所述在先截取部分中由第i個字符至最后一個字符組成的字符串的字符數目與所述在后截取部分中由第一個字符至該待確定字符組成的字符串的字符數目相等;
若是,則確定所述在先截取部分中由第i個字符至最后一個字符組成的字符串或者所述在后截取部分中由第一個字符至該待確定字符組成的字符串為待確定重疊部分;
當僅存在一個待確定重疊部分時,確定該待確定重疊部分為所述重疊的文字部分;
當存在多個待確定重疊部分時,確定字符數最多的待確定重疊部分為所述重疊的文字部分。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于珠海賽納打印科技股份有限公司,未經珠海賽納打印科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611233168.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:服務器
- 下一篇:信息傳輸方法及打印成像設備





