[發明專利]一種文字編改系統及編改的方法有效
| 申請號: | 201210338739.4 | 申請日: | 2012-09-14 |
| 公開(公告)號: | CN102929843A | 公開(公告)日: | 2013-02-13 |
| 發明(設計)人: | 王艷;瞿洋;梁洵;袁仁慧 | 申請(專利權)人: | 《中國學術期刊(光盤版)》電子雜志社 |
| 主分類號: | G06F17/21 | 分類號: | G06F17/21;G06K9/20 |
| 代理公司: | 北京捷誠信通專利事務所(普通合伙) 11221 | 代理人: | 魏殿紳 |
| 地址: | 100084 北京市海淀區清華園清華*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 文字 系統 方法 | ||
1.一種文字編改系統,其特征在于,所述系統包括:版面分析模塊、版面加工模塊及編改合并模塊,所述
版面分析模塊,用于處理版面非文字內容,并通過行列掃描分析出文檔中的每一單位塊,分析單位塊的排列屬性,計算所述單位塊的語種屬性,形成文檔的整體版面;
版面加工模塊,用于輔助版面分析模塊,對版面分析所得的單位塊及單位塊屬性進行調整;
編改合并模塊,利用版面分析產生的文檔,按不同的語種進行不同的識別和編改,生成不同的編改文本,并將不同的編改文本進行合并生成最終編改文本。
2.根據權利要求1所述的文字編改系統,其特征在于,所述版面分析模塊包括預處理單元和自動版面分析單元;所述版面加工模塊包括交互式版面分析單元;所述編改合并模塊包括識別編改單元和編改結果合并單元。
3.根據權利要求1所述的文字編改系統,其特征在于,根據所述行掃描得到每行的有效像素點個數,并對有效像素點個數的分布進行統計得到每行的上下邊界。
4.根據權利要求1所述的文字編改系統,其特征在于,所述列掃描是對每一行進行列掃描,統計處每一列的像素點個數,并對像素點個數特征進行統計得到每行的左右邊界。
5.根據權利要求3或4所述的文字編改系統,其特征在于,根據所述行的上下邊界和左右邊界得到所述文檔單位塊。
6.一種文字編改的方法,其特征在于,所述方法包括:
對版面非文字內容進行處理;
通過行列掃描分析出文檔中的每一單位塊,并計算出所述單位塊的語種屬性;
對需要交互式版面分析的單位塊及單位塊屬性進行調整;
通過不同的語種對文檔進行不同的識別和編改,生成不同的編改文本,并將不同的編改文本進行合并生成最終編改文本。
7.根據權利要求6所述的文字編改系統,其特征在于,所述行掃描得到每行的有效像素點個數,并對有效像素點個數的分布進行統計得到每行的上下邊界;
所述列掃描是對每一行進行列掃描,統計處每一列的像素點個數,并對像素點個數特征進行統計得到每行的左右邊界。
8.根據權利要求7所述的文字編改系統,其特征在于,根據所述行的上下邊界和左右邊界得到所述文檔單位塊。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于《中國學術期刊(光盤版)》電子雜志社,未經《中國學術期刊(光盤版)》電子雜志社許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210338739.4/1.html,轉載請聲明來源鉆瓜專利網。





