[發明專利]文本行識別方法及系統有效
| 申請號: | 201710433560.X | 申請日: | 2017-06-09 |
| 公開(公告)號: | CN107180239B | 公開(公告)日: | 2020-09-11 |
| 發明(設計)人: | 吳愛紅;胡雨隆;胡金水;竺博;魏思 | 申請(專利權)人: | 科大訊飛股份有限公司 |
| 主分類號: | G06K9/34 | 分類號: | G06K9/34 |
| 代理公司: | 深圳市威世博知識產權代理事務所(普通合伙) 44280 | 代理人: | 何青瓦 |
| 地址: | 230088 安徽省*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文本 識別 方法 系統 | ||
本發明公開了一種文本行識別方法及系統,該方法包括:接收待識別文本圖像;獲取所述待識別文本圖像的二值圖;利用所述二值圖及預先構建的版面類型識別模型,得到所述待識別文本圖像對應的版面類別圖;根據所述版面類別圖中的文本行上下類別結構關系得到文本行信息。本發明不僅可以提高文本行識別的準確性,而且通用性強,可以適應各種不同場景的變化。
技術領域
本發明涉及信息處理領域,具體涉及一種文本行識別方法及系統。
背景技術
隨著計算機科學與技術的發展,自動化信息處理能力和水平也得到了顯著的提高。文檔的電子化成為熱潮,尤其是在教育領域,如試題電子化以及衍生出的機器自動閱卷等。文檔中文本行的識別作為文檔電子化中必不可少的步驟之一,一直受到相關技術研究人員的重視。
現有主流的文本行識別方法如下:首先獲取待分析文本的圖像,然后對所述圖像進行包括降噪、對比度增強、灰度化、二值化等的預處理,接著基于二值化圖得到待分析文本中各個連通體,最后設計相應特征及規則,將同一行的連通體聚成一類,得到文本行信息。所述設計的特征如計算每個連通體像素點之間的距離,所述規則如縱坐標距離超過設定閾值的連通體聚到一類。
現有的文本行識別方法需要依賴人工設定特征及規則,該方法受主觀因素影響較強,且通用較差,往往只對當前設計特征和規則的場景效果較好,一旦分析場景變化,原先設計的特征及規則往往不再適用。而在現實應用中,特別是手寫文檔,書寫多變、隨意,尤其是含有數學公式的文檔,情況更為復雜,采用現有的文本行識別方法效果往往不盡人意。
發明內容
本發明提供一種文本行識別方法及系統,以解決現有的文本行識別因依賴人工特征及規則,存在的通用性差、受主觀因素影響的問題。
為此,本發明提供如下技術方案:
一種文本行識別方法,包括:
接收待識別文本圖像;
獲取所述待識別文本圖像的二值圖;
利用所述二值圖及預先構建的版面類型識別模型,得到所述待識別文本圖像對應的版面類別圖;
根據所述版面類別圖中的文本行上下類別結構關系得到文本行信息。
優選地,所述方法還包括按以下方式構建版面類型識別模型:
收集大量包含文本行的圖像,并標注所述圖像中各像素點所屬的版面類別;
將每張圖像的像素點及其對應的版面類別作為訓練數據,訓練得到版面類型識別模型。
優選地,所述版面類別包括:背景、文本、行區間、以及分式線。
優選地,在根據所述版面類別圖中的文本行上下類別結構關系得到文本行信息之前還包括:對所述版面類別圖進行后處理,具體包括:
檢查所述版面類別圖中是否有粘連行,如果有,則對所述粘連行進行分割;和/或
對所述版面類別圖中的斷裂行進行合并。
優選地,所述檢查所述版面類別圖中是否有粘連行包括:
將所述版面類別圖二值化,得到只含有文本行像素點的二值化圖;
獲取所述二值化圖中的各連通體,并取所述連通體的外接矩形;
如果所述外接矩形的高度大于設定的矩形高度閾值,則確定所述連通體為粘連行;
所述對所述粘連行進行分割包括:
對于所述粘連行,從最左邊開始逐步向右分析,確定各粘連不確定區域;
基于所述待識別文本圖像的二值圖獲取所述不確定區域中的所有連通體;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于科大訊飛股份有限公司,未經科大訊飛股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710433560.X/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:太陽電池光衰測試的快速制樣設備
- 下一篇:BIM模型數據壓縮、還原方法及裝置





