[發明專利]基于YOLOv7算法的OCR字符檢測方法及裝置在審
| 申請號: | 202211170987.2 | 申請日: | 2022-09-23 |
| 公開(公告)號: | CN115527210A | 公開(公告)日: | 2022-12-27 |
| 發明(設計)人: | 姚正;劉超;張慶慶;李建勛;李歡 | 申請(專利權)人: | 昆山佰奧軟件有限公司 |
| 主分類號: | G06V30/146 | 分類號: | G06V30/146;G06V30/19;G06V10/82;G06N3/04 |
| 代理公司: | 蘇州九方專利代理事務所(特殊普通合伙) 32398 | 代理人: | 張小培 |
| 地址: | 215300 江蘇省蘇州*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 yolov7 算法 ocr 字符 檢測 方法 裝置 | ||
本發明公開了一種基于YOLOv7算法的OCR字符檢測方法及裝置,該檢測方法包括:構建OCR字符檢測網絡模型,OCR字符檢測網絡模型采用YOLOv7網絡結構作為基礎框架,并在YOLOv7網絡結構的骨干特征提取網絡中采用深度可分離卷積運算方式進行深層特征提取,及在YOLOv7網絡結構的頭部預測模塊中嵌入SE注意力機制模塊進行關鍵特征的顯化和提取;建立訓練集和驗證集,用于OCR字符檢測網絡模型進行訓練學習和檢測驗證;配置調用及部署模塊,用于將訓練好的OCR字符檢測網絡模型轉化成統一文件格式的通用模型,并將通用模型部署到工程平臺中后,對訓練集和/或驗證集進行檢測、輸出OCR字符預測結果。該檢測方法的參數量和運算量小,可達到運算精度高、速度快的輕量型OCR字符檢測效果。
技術領域
本發明涉及OCR字符圖像處理技術領域,尤其涉及一種基于YOLOv7算法的OCR字符檢測方法及裝置。
背景技術
現代生活中,電子設備在人們的生產、生活中得到了廣泛應用。OCR字符是指打印在電子設備上的字符,工業上可以通過OCR字符快速獲取電子設備的相關生產信息。OCR字符通常受到電子設備尺寸和制作工藝的影響,字符的大小難以通過肉眼直接快速識別,因此OCR字符識別一直以來是學者密切關注的課題。隨著計算機技術的不斷發展,基于深度學習的OCR字符方法在OCR字符檢測技術上取得了新進展,通過其強大的特征泛化和表達能力,使其成為當前圖像處理多領域的主要研究方法。目前OCR字符檢測/識別主要采用的方法兩種:一種是基于傳統方法的OCR字符檢測方法,另一種是基于深度學習的OCR字符檢測方法。
基于傳統的OCR字符檢測方法,是根據電子設備上OCR字符的形狀和字符特點,設置相應的閾值實現OCR字符檢測效果,通過設置合理的閾值或者應用多重圖像形態學處理的方式人為篩選特征,通常能夠根據實際情況能實現一定精度的OCR字符檢測效果,然而這些方法無疑都需要大量的人為經驗和根據電子設備的實際背景環境來開展更多的復雜的圖像處理過程,如上所述,傳統的圖像處理方法大多存在普適性差,復雜度高的問題,針對現有的復雜場景下,要求使用簡單,穩定度高,并保持高精度的實踐工業部署需求,采用傳統圖像處理的方法缺乏吸引力。
基于深度學習的OCR字符檢測方法,過去OCR字符檢測模型是采用高深度、大寬度的卷積神經網絡來實現的,如此通常可以得到一個高精度的檢測模型。然而,隨著網絡深度的加深,網絡的參數量和運算量也會隨之大幅提升,從而嚴重影響到OCR字符檢測模型在工業部署時的檢測速度和程序運行空間的占用。
因此,如何以一個參數量少、權重空間占用小的檢測網絡,實現得到一個精度高、速度快的OCR字符檢測模型,成為了當下亟需解決的技術問題。有鑒于此,特提出本發明。
發明內容
為了克服上述缺陷,本發明提供了一種基于YOLOv7算法的OCR字符檢測方法及裝置,其參數量和運算量小,可達到運算精度高、速度快的輕量型OCR字符檢測效果。
本發明為了解決其技術問題所采用的技術方案是:一種基于YOLOv7算法的OCR字符檢測方法,包括:
構建OCR字符檢測網絡模型,所述OCR字符檢測網絡模型采用YOLOv7網絡結構作為基礎框架,并在YOLOv7網絡結構的骨干特征提取網絡中采用深度可分離卷積運算方式進行深層特征提取,以及在YOLOv7網絡結構的頭部預測模塊中嵌入SE注意力機制模塊進行關鍵特征的顯化和提取;
建立訓練集和驗證集,用于所述OCR字符檢測網絡模型進行訓練學習和檢測驗證;
配置調用及部署模塊,用于將訓練好的所述OCR字符檢測網絡模型轉化成統一文件格式的通用模型,并將所述通用模型部署到工程平臺中后,對所述訓練集和/或所述驗證集進行檢測、輸出OCR字符預測結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于昆山佰奧軟件有限公司,未經昆山佰奧軟件有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211170987.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:斜坡信號發生電路、圖像傳感器以及讀出電路
- 下一篇:多次蒸煮的馬蹄糕生產設備





