[發明專利]一種應用于電力企業的OCR方法在審
| 申請號: | 202010475177.2 | 申請日: | 2020-05-29 |
| 公開(公告)號: | CN113743159A | 公開(公告)日: | 2021-12-03 |
| 發明(設計)人: | 王治華;高峰;陳宏福 | 申請(專利權)人: | 國網上海市電力公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/32;G06K9/46;G06F40/18 |
| 代理公司: | 武漢江楚智匯知識產權代理事務所(普通合伙) 42228 | 代理人: | 姚宏博 |
| 地址: | 200122 上*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 應用于 電力企業 ocr 方法 | ||
1.一種應用于電力企業的OCR方法,其特征在于,包括以下步驟:
(1)對采集的圖片進行預處理,得到預處理后的圖片;
(2)使用卷積神經網絡提取出所述預處理后的圖片中的文字特征和表格特征;
(3)將所述步驟2提取出的所述文字特征通過文本分類模型進行文字特征匹配,識別出文字;
(4)通過所述步驟2提取出的所述表格特征繪制表格;
(5)將所述步驟3識別出的所述文字與所述步驟4繪制的表格進行合成,得到包含文字和表格的識別結果;
(6)將所述識別結果生成word進行保存。
2.根據權利要求1所述的應用于電力企業的OCR方法,其特征在于:所述預處理包括對圖片進行去噪、灰度變換、二值變換和偏移矯正。
3.根據權利要求2所述的應用于電力企業的OCR方法,其特征在于:通過高斯濾波的方式對圖像進行去噪處理。
4.根據權利要求1所述的應用于電力企業的OCR方法,其特征在于:所述文本分類模型訓練的數據集使用電力調度常用的文本樣本集合和通用文本樣本。
5.根據權利要求1所述的應用于電力企業的OCR方法,其特征在于:所述步驟4中,還包括對表格通過輪廓檢測、表格特征點檢測結合進行傾斜校正。
6.根據權利要求5所述的應用于電力企業的OCR方法,其特征在于:還包括對表格內的橫線和豎線進行修復并重新繪制。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國網上海市電力公司,未經國網上海市電力公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010475177.2/1.html,轉載請聲明來源鉆瓜專利網。





