[發明專利]提高OCR識別率的方法和系統在審
| 申請號: | 202011024700.6 | 申請日: | 2020-09-25 |
| 公開(公告)號: | CN112163578A | 公開(公告)日: | 2021-01-01 |
| 發明(設計)人: | 陳海波;于強 | 申請(專利權)人: | 深蘭人工智能芯片研究院(江蘇)有限公司 |
| 主分類號: | G06K9/32 | 分類號: | G06K9/32;G06K9/34;G06K9/62;G06T3/60 |
| 代理公司: | 常州佰業騰飛專利代理事務所(普通合伙) 32231 | 代理人: | 陳紅橋 |
| 地址: | 213000 江蘇省常州市武進*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 提高 ocr 識別率 方法 系統 | ||
本發明提供了一種提高OCR識別率的方法和系統,其中,所述方法包括以下步驟:獲取待識別物體的圖像,其中待識別物體設有位置識別點;對待識別物體的圖像進行處理以標出位置識別點所在區域和待識別物體中的目標區域;對標出的目標區域的圖像進行處理;對目標區域圖像和處理后的目標區域圖像進行OCR識別,以得到目標區域的識別字符;比對目標區域的識別字符和目標區域的實際字符;若目標區域的識別字符和目標區域的實際字符匹配,則計算位置識別點所在區域和目標區域之間的偏移量;根據位置識別點和偏移量對同一類型的待識別物體進行OCR識別。本發明能夠通過待識別物體上的位置識別點來準確截取待識別物體的目標區域,從而能夠提升OCR的識別率和準確度。
技術領域
本發明涉及OCR識別技術領域,具體涉及一種提高OCR識別率的方法和一種提高OCR識別率的系統。
背景技術
在產線上對芯片上的字符進行OCR時,一般是將裝有多塊芯片的滑動設備經過相機鏡頭,以對芯片進行拍攝識別。但是,在通過光電信號硬觸發相機對各個芯片進行依次拍照時,由于滑動設備速度較快,相機響應硬觸發拍照會出現延遲,使得拍到芯片照片會出現輕微偏移,從而容易導致ROI截取的部分可能會導致出現干擾字符或者丟失部分目標字符,造成字符識別的準確度下降。
發明內容
本發明旨在至少在一定程度上解決上述技術中的技術問題之一。為此,本發明的一個目的在于提出一種提高OCR識別率的方法,能夠通過待識別物體上的位置識別點來準確截取待識別物體的目標區域,從而能夠提升OCR的識別率和準確度。
本發明的第二個目的在于提出一種提高OCR識別率的系統。
為達到上述目的,本發明第一方面實施例提出了一種提高OCR識別率的方法,包括以下步驟:獲取待識別物體的圖像,其中,所述待識別物體設有位置識別點;對所述待識別物體的圖像進行處理以標出所述位置識別點所在區域和所述待識別物體中的目標區域;對標出的所述目標區域的圖像進行處理;對所述目標區域圖像和處理后的所述目標區域圖像進行OCR識別,以得到所述目標區域的識別字符;比對所述目標區域的識別字符和所述目標區域的實際字符;若所述目標區域的識別字符和所述目標區域的實際字符匹配,則計算所述位置識別點所在區域和所述目標區域之間的偏移量;根據所述位置識別點和所述偏移量對同一類型的所述待識別物體進行OCR識別。
根據本發明實施例提出的提高OCR識別率的方法,通過獲取待識別物體的圖像,并對待識別物體的圖像進行處理以標出位置識別點所在區域和待識別物體中的目標區域,以及對標出的目標區域的圖像進行處理,然后對目標區域圖像和處理后的目標區域圖像進行OCR識別,以得到目標區域的識別字符,并比對目標區域的識別字符和目標區域的實際字符,其中,若目標區域的識別字符和目標區域的實際字符匹配,則計算位置識別點所在區域和目標區域之間的偏移量,最后根據位置識別點和偏移量對同一類型的待識別物體進行OCR識別,由此,能夠通過待識別物體上的位置識別點來準確截取待識別物體的目標區域,從而能夠提升OCR的識別率和準確度。
另外,根據本發明上述實施例提出的提高OCR識別率的方法還可以具有如下附加的技術特征:
根據本發明的一個實施例,所述待識別物體采用固定模塊印刻。
根據本發明的一個實施例,對所述待識別物體的圖像進行處理以標出所述位置識別點所在區域和所述待識別物體中的目標區域,包括以下步驟:采用ROI標出所述位置識別點所在區域,并獲取所述位置識別點所在區域的標定坐標;采用ROI標出所述待識別物體中的目標區域,并獲取所述目標區域的標定坐標和尺寸數據。
根據本發明的一個實施例,對標出的所述目標區域的圖像進行處理,包括以下步驟:設定多個旋轉角度;根據多個所述旋轉角度分別對標出的所述目標區域的圖像進行旋轉處理,并對應得到多個旋轉圖像。
根據本發明的一個實施例,采用深度學習算法分別對標出的所述目標區域的圖像和多個所述旋轉圖像進行OCR識別,并對應得到多組所述目標區域的識別字符。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深蘭人工智能芯片研究院(江蘇)有限公司,未經深蘭人工智能芯片研究院(江蘇)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011024700.6/2.html,轉載請聲明來源鉆瓜專利網。





