[發明專利]一種標簽中字符的檢測方法、裝置、設備及可讀介質有效
| 申請號: | 202110904891.3 | 申請日: | 2021-08-07 |
| 公開(公告)號: | CN113743394B | 公開(公告)日: | 2023-08-11 |
| 發明(設計)人: | 許博 | 申請(專利權)人: | 蘇州浪潮智能科技有限公司 |
| 主分類號: | G06V30/14 | 分類號: | G06V30/14;G06V30/19;G06V10/82;G06N3/084 |
| 代理公司: | 北京連和連知識產權代理有限公司 11278 | 代理人: | 劉小峰;張濤 |
| 地址: | 215000 江蘇省蘇州*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 標簽 字符 檢測 方法 裝置 設備 可讀 介質 | ||
本發明公開了一種標簽中字符的檢測方法,包括以下步驟:檢測拍攝圖片中標簽位置并進行剪切,以得到標簽圖片;基于所述標簽圖片中字符區域的形狀進行位置校正,并對校正后的所述標簽圖片進行縮放和歸一化處理以得到預設尺寸的字符區域圖片;基于神經網絡模型對所述字符區域圖片進行文本框檢測,以得到文本框信息和字符個數;以及判斷所述字符個數是否達到預設字符數,若是所述字符個數達到預設字符數,則輸出所述文本框信息。本發明還公開了一種標簽中字符的檢測裝置、計算機設備和可讀存儲介質。本發明通過采用標簽圖片提取、特征提取、特征融合、文本檢測卡合并來進行標簽字符的提取,實現了輸出文本框信息可在終端設備直接被應用。
技術領域
本發明涉及圖像識別技術領域,尤其涉及一種標簽中字符的檢測方法、裝置、設備及可讀介質。
背景技術
在計算機視覺領域,通常檢測字符使用的是形態學操作方法,利用計算機視覺中的圖像形態學操作,包括膨脹、腐蝕等基本操作,即可實現簡單場景的文字檢測,例如檢測書籍拍照圖像中的文字區域位置。
然而現有的方式有著無法避免的缺點,傳統的檢測方法一般都是掃描整張圖像,這樣就會引入許多自然場景的干擾像素,例如存在許多類似字符的符號或者物體,導致加大了人工特征尋找目標的難度。除此之外,傳統檢測的方法大多都需要人工設置閾值來調整檢測靈敏度,閾值過高會導致檢測過多干擾因素從而無法進行人工特征匹配,而閾值過低會導致無法檢測到所需字符。
基于深度學習的字符檢測算法在過去幾年里受到了較為重視的研究,隨著人工智能的發展以及一些基于CNN(Convolutional?Neural?Networks,深度卷積神經網絡)網絡的字符算法的發展,例如,經典字符檢測網絡CTPN(Detecting?Text?in?Natural?Image?withConnectionist?Text?Proposal?Network,基于連接預選框網絡的文本檢測)?;谏疃葘W習的檢測方法已經取得了較好的效果,并且隨著深度卷積神經網絡架構性能的提升,其檢測性能也會越來越好。
然而這些傳統的深度學習的字符檢測方法所使用的網絡模型很龐大,需求的算力也很高,很難將其直接部署在終端設備上面,因為終端設備的儲存和算力都很有限。
發明內容
有鑒于此,本發明實施例的目的在于提出一種標簽中字符的檢測方法、裝置、設備及可讀介質,通過采用標簽圖片提取、特征提取、特征融合、文本檢測卡合并來進行標簽字符的提取,實現輸出文本框信息可在終端設備直接被應用。
基于上述目的,本發明實施例的一方面提供了一種標簽中字符的檢測方法,包括以下步驟:檢測拍攝圖片中標簽位置并進行剪切,以得到標簽圖片;基于所述標簽圖片中字符區域的形狀進行位置校正,并對校正后的所述標簽圖片進行縮放和歸一化處理以得到預設尺寸的字符區域圖片;基于神經網絡模型對所述字符區域圖片進行文本框檢測,以得到文本框信息和字符個數;以及判斷所述字符個數是否達到預設字符數,若是所述字符個數達到預設字符數,則輸出所述文本框信息。
在一些實施方式中,還包括:若是所述字符個數未達到預設字符數,則進行文本框合并或非極大值抑制處理,以得到最終文本框信息。
在一些實施方式中,進行文本框合并或非極大值抑制處理,以得到最終文本框信息還包括:基于所述文本框信息和所述字符個數生成得分;判斷所述文本框信息中的中點距離是否小于預設中點距離;若是所述文本框信息中的中點距離小于預設中點距離,則根據所述得分進行文本框合并以得到最終文本框信息;若是所述文本框信息中的中點距離不小于預設中點距離,則進行非極大值抑制處理以得到最終文本框信息。
在一些實施方式中,檢測拍攝圖片中標簽位置并進行剪切,以得到標簽圖片包括:獲取拍攝圖片,并基于邊緣檢測算法檢測所述拍攝圖片中標簽位置;基于所述標簽位置進行剪切,以得到標簽圖片。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于蘇州浪潮智能科技有限公司,未經蘇州浪潮智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110904891.3/2.html,轉載請聲明來源鉆瓜專利網。





