[發明專利]圖片文本的識別方法、系統、設備和存儲介質在審
| 申請號: | 202110213721.0 | 申請日: | 2021-02-25 |
| 公開(公告)號: | CN112926565A | 公開(公告)日: | 2021-06-08 |
| 發明(設計)人: | 何小臻 | 申請(專利權)人: | 中國平安人壽保險股份有限公司 |
| 主分類號: | G06K9/20 | 分類號: | G06K9/20;G06K9/34 |
| 代理公司: | 深圳國新南方知識產權代理有限公司 44374 | 代理人: | 張曾明 |
| 地址: | 518000 廣東省深圳市福田區益田路5033號*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 圖片 文本 識別 方法 系統 設備 存儲 介質 | ||
本發明提供一種圖片文本的識別方法,識別方法通過獲取待識別圖片,對圖片進行預處理;利用預設文本檢測模型對圖片進行檢測,得到圖片中每個文本行的坐標;根據每個文本行的坐標得到每個文本行對應的寬度值;將文本行根據寬度值進行排序,將寬度最長和最短的文本行拼接以形成長文本,并重復操作,在將要超過寬度閾值時停止拼接;檢測長文本,若長文本寬度值未達到寬度閾值,將根據寬度閾值對長文本寬度進行修補;重復操作,直到剩下文本行所形成的長文本都達到寬度閾值,形成長文本集合;將長文本集合輸入預設文本識別模型進行識別,將返回的結果進行拆解,得到圖片的識別結果。本發明通過二次批處理的底層邏輯,有效提升后臺模型的處理時間。
技術領域
本發明涉及圖像處理技術領域,特別是涉及圖片文本的識別方法、系統、設備和存儲介質。
背景技術
當前人工智能領域,算法落地或者工程部署,市面上有幾個常用的部署框架,比如TensorFlow的TensorFlow-Sering、百度的Paddle平臺、英偉達的TensorRT框架等。TensorRT是一個高性能的深度學習推理(Inference)優化器,可以為深度學習應用提供低延遲、高吞吐率的部署推理。TensorRT可用于對超大規模數據中心、嵌入式平臺或自動駕駛平臺進行推理加速。TensorRT現已能支持TensorFlow、Caffe、Mxnet、Pytorch等幾乎所有的深度學習框架,將TensorRT和NVIDIA的GPU結合起來,能在幾乎所有的框架中進行快速和高效的部署推理。以英偉達的TensorRT框架舉例,針對文本識別的場景,普遍的解決思路是:從輸入的圖片中檢測出所有文本行,然后把這些文本行依次送入識別模型做文本識別。
由于輸入圖片的文本行數量不定,特別是對于文本密集的圖片,測出的文本行的數量會多很多,即使像英偉達的TensorRT框架支持批處理的操作,整體處理完成的耗時也會大很多。因此,為了加速處理時間,我們提出了一種新的圖片文本的識別方法。
發明內容
基于此,本發明提供了一種圖片文本的識別方法、系統、設備和存儲介質,以加快圖像文本的識別速度。
為實現上述目的,本發明提供一種圖片文本的識別方法,所述識別方法包括:
獲取待識別圖片,對所述圖片進行預處理;
利用預先訓練完成的文本檢測模型對經過預處理的圖片進行檢測,得到圖片中每個文本行的坐標;
根據每個文本行的坐標計算得到每個文本行對應的寬度值;
將文本行根據寬度值進行排序,遍歷所有的寬度值,將寬度最長的文本行和寬度最短的文本行進行拼接以形成長文本,并重復操作,當正在拼接的長文本寬度值將要超過寬度閾值時停止拼接;
檢測該長文本,若該長文本寬度值未達到寬度閾值,將根據寬度閾值對該長文本寬度進行修補;
對剩下的文本行進行拼接和修補的操作,直到所有文本行都形成達到寬度閾值的長文本,以形成長文本集合;
將長文本集合輸入預設文本識別模型進行識別,并把返回的結果進行拆解,得到待識別圖片的識別結果。
優選的,所述對所述圖片進行預處理的步驟包括:
對所述圖片進行縮放,所述圖片縮放的最大寬度不超過1600像素,最大高度不超過2400像素,最小寬度不小于600像素,最小高度不小于800像素;
將縮放后的圖片轉換成灰度圖。
優選的,所述利用預先訓練完成的文本檢測模型對經過預處理的圖片進行檢測,得到圖片中每個文本行的坐標的步驟包括:
調用訓練好的文本檢測模型,所述文本檢測模型采用dbnet算法,將經過預處理的圖片輸入到所述文本檢測模型,所述文本檢測模型輸出所述圖片像素點中對應文本的概率值;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國平安人壽保險股份有限公司,未經中國平安人壽保險股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110213721.0/2.html,轉載請聲明來源鉆瓜專利網。





