[發明專利]光學字符快速識別方法及系統有效
| 申請號: | 202110584533.9 | 申請日: | 2021-05-27 |
| 公開(公告)號: | CN113343967B | 公開(公告)日: | 2022-10-25 |
| 發明(設計)人: | 王琳;李小寧;張帆;王正中;耿世超;儲敬;李昱 | 申請(專利權)人: | 山東師范大學 |
| 主分類號: | G06V10/22 | 分類號: | G06V10/22;G06V10/25;G06V30/146 |
| 代理公司: | 濟南圣達知識產權代理有限公司 37221 | 代理人: | 黃海麗 |
| 地址: | 250014 *** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 光學 字符 快速 識別 方法 系統 | ||
1.光學字符快速識別方法,其特征是,包括:
獲取待處理圖像;對待處理圖像進行預處理;具體包括:將待處理圖像的長和寬均處理成N的倍數,N為設定值,N為整數;得到第一處理圖像;對第一處理圖像進行降采樣處理,得到第二處理圖像;對第二處理圖像進行標準化處理Normalization,得到標準化處理后的圖像;
將預處理后的圖像進行文本檢測,得到含有矩形文字包圍框的圖像;
對矩形文字包圍框內的矩形文字區域進行文本識別,得到識別文本;
對識別后的文本進行文本規整,得到規整后的文本;具體包括:
(1)對識別出的所有文本特征,提取每一列所有識別文本特征中每個識別文本特征的橫坐標;其中,以整個圖像左上角的點作為坐標原點,以水平方向作為坐標橫軸,以垂直方向作為坐標縱軸,將每個識別文本特征的矩形文字包圍框的左上角點在整個圖像內的橫坐標,作為當前識別文本特征的橫坐標;
(2)給定第一閾值;按照從上往下順序提取每一列的相鄰兩行的識別文本特征;
(3)判斷每一列中相鄰兩行兩個識別文本特征的橫坐標差值是否大于設定第一閾值,若大于,則回到(2);否則,保存每一列的識別文本特征以及其縱坐標;然后進入(4);
(4):得到各列項的文本數據以后,提取每一行所有識別文本特征中每個識別文本特征的縱坐標;
(5):給定第二閾值,并按照從左到右的順序,依次選取(3)所保存的每一行的相鄰兩列的識別文本特征;
(6):判斷每一行中相鄰兩個識別文本特征的縱坐標差是否大于第二閾值,若大于則回到(5),否則保存組合后的各橫行文本數據;
對規整后的文本,進行文本糾正,得到最終光學字符識別結果;具體包括:
將識別出的文本數據,與數據庫中的文本之間的萊文斯坦比;其中,所述數據庫中預存儲若干個文本數據;
判斷萊文斯坦比是否超出設定閾值;如果超出設定閾值,則將萊文斯坦比最大值對應的數據庫中的文本作為最匹配文本輸出;
如果小于設定閾值,則將識別出的文本作為新的文本補充到數據庫中。
2.如權利要求1所述的光學字符快速識別方法,其特征是,將預處理后的圖像進行文本檢測,得到含有矩形文字包圍框的圖像;具體包括:
采用Differentiable Binarization文本檢測算法,對預處理后的圖像進行文本檢測,得到含有矩形文字包圍框的圖像。
3.如權利要求1所述的光學字符快速識別方法,其特征是,對矩形文字包圍框內的矩形文字區域進行文本識別,得到識別文本;具體包括:
采用訓練后的CRNN網絡模型,對矩形文字包圍框內的矩形文字區域進行文本識別,得到文本識別結果;
所述文本識別結果,包括若干個識別文本特征,每個識別文本特征,包括:數字、數值范圍或由文字組成的詞匯。
4.如權利要求1所述的光學字符快速識別方法,其特征是,對第一處理圖像進行降采樣處理,得到第二處理圖像;具體包括:對第一處理圖像進行五次兩倍降采樣處理。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于山東師范大學,未經山東師范大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110584533.9/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種行道樹保溫層捆扎裝置
- 下一篇:一種保溫防震螺桿真空泵





