[發明專利]一種基于文字位置信息的OCR優化方法及系統在審
| 申請號: | 202011090602.2 | 申請日: | 2020-10-13 |
| 公開(公告)號: | CN112308057A | 公開(公告)日: | 2021-02-02 |
| 發明(設計)人: | 張麗麗;劉宏亮;劉偉珊;王菲 | 申請(專利權)人: | 山東國贏大數據產業有限公司 |
| 主分類號: | G06K9/20 | 分類號: | G06K9/20 |
| 代理公司: | 濟南圣達知識產權代理有限公司 37221 | 代理人: | 董雪 |
| 地址: | 250000 山東省濟南市歷下區經*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 文字 位置 信息 ocr 優化 方法 系統 | ||
1.一種基于文字位置信息的OCR優化方法,其特征在于,包括:
設定需要提取的約束信息項及提取范圍;
對待識別圖像進行預處理,獲取所述圖像中的文字及位置信息;
計算所有文字信息的平均行間距,確定當前文字與下一行文字之間的間距,基于所述間距與平均行間距的大小,判斷當前文字與下一行文字是否需要合并;
對上述提取到的信息項文字數據進行格式化輸出。
2.如權利要求1所述的一種基于文字位置信息的OCR優化方法,其特征在于,對待識別圖像進行預處理,包括:對圖像進行灰度化、二值化、噪聲去除以及傾斜矯正的預處理操作。
3.如權利要求1所述的一種基于文字位置信息的OCR優化方法,其特征在于,設定需要提取的約束信息項及提取范圍,具體包括:需要提取的圖像中的文字信息。
4.如權利要求1所述的一種基于文字位置信息的OCR優化方法,其特征在于,通過臨近連通區域搜索方法,逐行搜索出現在圖片中的文字并記錄坐標位置,截取文字所處區域,識別文字,得到圖片所有文字及其坐標位置信息。
5.如權利要求1所述的一種基于文字位置信息的OCR優化方法,其特征在于,計算所有文字信息的平均行間距,具體包括:
遍歷提取的圖像中每一行文字的坐標,基于所述坐標值計算當前行與下一行的行間距;
將所有行間距累加求和;基于累加值與行數的比值確定平均行間距。
6.如權利要求1所述的一種基于文字位置信息的OCR優化方法,其特征在于,基于所述間距與平均行間距的大小,判斷當前文字與下一行文字是否需要合并,具體包括:
當前行與下一行的行間距小于平均行間距時,當前行與下一行的文字合并提取;
當前行與下一行的行間距大于平均行間距時,停止合并。
7.如權利要求1所述的一種基于文字位置信息的OCR優化方法,其特征在于,提取每一個待識別的約束信息項,對提取到的信息項文字數據進行格式化輸出。
8.一種基于文字位置信息的OCR優化系統,其特征在于,包括:
模板設計模塊,用于設定需要提取的約束信息項及提取范圍;
文字位置信息識別模塊,用于對待識別圖像進行預處理,獲取所述圖像中的文字及位置信息;
優化處理模塊,用于計算所有文字信息的平均行間距,確定當前文字與下一行文字之間的間距,基于所述間距與平均行間距的大小,判斷當前文字與下一行文字是否需要合并;
結構化輸出模塊,用于對上述提取到的信息項文字數據進行格式化輸出。
9.一種終端設備,其包括處理器和計算機可讀存儲介質,處理器用于實現各指令;計算機可讀存儲介質用于存儲多條指令,其特征在于,所述指令適于由處理器加載并執行權利要求1-7任一項所述的基于文字位置信息的OCR優化方法。
10.一種計算機可讀存儲介質,其中存儲有多條指令,其特征在于,所述指令適于由終端設備的處理器加載并執行權利要求1-7任一項所述的基于文字位置信息的OCR優化方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于山東國贏大數據產業有限公司,未經山東國贏大數據產業有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011090602.2/1.html,轉載請聲明來源鉆瓜專利網。
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置





