[發明專利]場景圖像中的文本檢測方法、裝置及計算機設備在審
| 申請號: | 202010223195.1 | 申請日: | 2020-03-26 |
| 公開(公告)號: | CN111582021A | 公開(公告)日: | 2020-08-25 |
| 發明(設計)人: | 高遠 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/20;G06K9/34;G06N3/04;G06N3/08 |
| 代理公司: | 深圳市精英專利事務所 44242 | 代理人: | 李翔宇 |
| 地址: | 518000 廣東省深圳市福田區福*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 場景 圖像 中的 文本 檢測 方法 裝置 計算機 設備 | ||
本發明涉及圖像處理技術領域,具體涉及場景圖像的文本檢測方法、裝置及計算機設備,該方法包括:通過訓練后的全卷積網絡模型,檢測確定所述場景圖像中的若干個文本預測框;篩選在所述文本預測框內的高置信度像素點;根據所述高置信度像素點,計算所述文本預測框對應的最小外接矩形;在重疊度大于預設的重疊度閾值時,通過所述最小外接矩形調整所述文本預測框的寬度;在所述場景圖像中切割獲得待識別文本圖像并識別其中的文本信息。本發明實施例提供的方法可以在使用EAST方法實現文本檢測的基礎上,通過高置信度的區域對文本預測框的寬度進行校正和調整,使其寬度可靠的被縮小,實現更加精確的文本識別。
技術領域
本發明涉及圖像處理技術領域,具體涉及場景圖像中的文本檢測方法、裝置及計算機設備。
背景技術
基于計算機視覺的文字識別在現今的大數據時代具有非常重大的使用意義。其是許多智能化功能(例如推薦系統、機器翻譯等)的實現基礎。而文本檢測作為文字識別過程的前提條件,其檢測精準度對于文字識別的效果具有顯著的影響。
在復雜的自然場景下,文本存在多種不同位置的分布、排布形式多樣、分布方向不一致以及多語言混合等的特點,因此文本檢測的任務極具挑戰性。
傳統技術中存在一種被稱為CTPN的文本檢測算法,其基于將完整文本先分割檢測再合并的思路來實現自然場景下的文本檢測。傳統技術通過分割再合并的方式檢測文本一方面檢測精度不準確,另一方面會過度消耗檢測時間,用戶體驗差,基于此,還有人提出了一種被稱為EAST(an efficient and accurate scene text detector)的文本檢測方法。其借助FCN的架構來進行特征提取和學習,直接進行端到端的訓練和優化,消除不必要的中間步驟。
但是,在EAST的實際應用過程中,仍然存在著許多的局限性,無法很好的滿足實際使用的需求。例如,最終獲得的文本預測框的寬度與場景中實際的文本不相符,因此傳統技術需要在EAST的實際應用基礎上,進一步改進。
發明內容
本發明旨在解決現有的EAST算法識別精度無法滿足實際使用需求的技術問題。
為解決上述技術問題,第一方面,本發明實施例提供了一種場景圖像中的文本檢測方法,包括:對全卷積網絡模型進行訓練優化;
通過訓練后的所述全卷積網絡模型,檢測確定所述場景圖像中的若干個文本預測框;篩選在所述文本預測框內,置信度大于預設的置信度閾值的像素點作為高置信度像素點,所述置信度為所述全卷積網絡模型輸出的,像素點屬于文本預測框的概率;根據所述高置信度像素點,計算所述文本預測框對應的最小外接矩形,所述最小外接矩形為將所述文本預測框中所有高置信度像素點包含在內,面積最小的矩形;計算所述文本預測框與對應的最小外接矩形之間的重疊度;在所述重疊度大于預設的重疊度閾值時,通過所述最小外接矩形調整所述文本預測框的寬度;在所述場景圖像中切割所述調整后的文本預測框,獲得待識別文本圖像;識別所述待識別文本圖像中的文字。
可選地,在計算所述文本預測框與對應的最小外接矩形之間的重疊度之前,所述方法還,包括:
計算所述最小外接矩形內的高置信度像素點的置信度平均值;
在所述置信度平均值小于預設的篩選閾值時,剔除所述最小外接矩形。
可選地,所述對全卷積網絡模型進行訓練優化,包括:構建全卷積網絡模型;標注訓練標簽,構建訓練數據集;通過所述訓練數據集和預設的損失函數,對所述全卷積網絡模型進行訓練優化。
可選地,所述計算所述文本預測框與對應的最小外接矩形之間的重疊度,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010223195.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種數據搜索方法以及裝置
- 下一篇:一種任務數據處理方法以及裝置
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





