[發明專利]智能識別圖片文字的方法、裝置、計算機設備及存儲介質在審
| 申請號: | 202011590830.6 | 申請日: | 2020-12-29 |
| 公開(公告)號: | CN112686243A | 公開(公告)日: | 2021-04-20 |
| 發明(設計)人: | 謝達榮 | 申請(專利權)人: | 平安普惠企業管理有限公司 |
| 主分類號: | G06K9/20 | 分類號: | G06K9/20;G06K9/46;G06N3/04;G06N3/08 |
| 代理公司: | 深圳市世聯合知識產權代理有限公司 44385 | 代理人: | 汪琳琳 |
| 地址: | 518000 廣東省深圳市前海深港合作區前*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 智能 識別 圖片 文字 方法 裝置 計算機 設備 存儲 介質 | ||
1.一種智能識別圖片文字的方法,其特征在于,包括下述步驟:
接收多張數據單圖片,基于所述數據單圖片生成初始單文字圖層,其中,不同的數據單圖片之間的文字類型不同;
標注所述初始單文字圖層,生成目標單文字圖層,并基于所述目標單文字圖層生成單字體圖片庫;
接收目標字符串,基于所述目標字符串提取所述單字體圖片庫中的目標單文字圖層,基于所述目標單文字圖層和預設的背景圖片生成訓練樣本,其中,所述背景圖片中包含噪聲;
將所述訓練樣本輸入至預設的初始文字識別模型中,獲得第一文字識別結果,并基于所述第一文字識別結果和預設的損失函數計算損失值,直至所述損失函數收斂,獲得目標文字識別模型;
接收待識別數據單圖片,將所述待識別數據單圖片輸入至目標文字識別模型中,獲得第二文字識別結果。
2.根據權利要求1所述的智能識別圖片文字的方法,其特征在于,所述基于所述數據單圖片生成初始單文字圖層的步驟包括:
基于預先訓練的行文本切分模型,切分所述數據單圖片中的文字,獲得行文字圖片;
將所述文字圖片轉換為灰度圖,并基于所述灰度圖生成圖片直方圖;
基于預設的三角法獲取所述圖片直方圖中的二值化閾值,并通過所述二值化閾值調整所述灰度圖,獲得文字二值化圖片;
獲取所述文字二值化圖片中每個連通域的高和寬,并根據所述高和寬確定出當前連通域的相鄰區域,將所述當前連通域和所述相鄰區域作為待識別區域;
判斷所述待識別區域中是否含除所述當前連通域以外的連通域,在所述待識別區域中不含有除所述當前連通域以外的連通域時,將所述待識別區域設定為孤立域;
去除所述孤立域,獲得調整后的文字圖層,并基于預先訓練的單文字切分模型切分所述調整后的文字圖層生成所述單文字圖層。
3.根據權利要求2所述的智能識別圖片文字的方法,其特征在于,所述通過所述二值化閾值調整所述灰度圖,獲得文字二值化圖片的步驟包括:
對比所述灰度圖中每個像素的灰度值是否超過所述二值化閾值;
在所述灰度值超過所述二值化閾值時,將對應的像素的灰度值調整為預設的第一灰度值;
在所述灰度值未超過所述二值化閾值時,將對應的像素的灰度值調整為預設的第二灰度值;
當完成對所述灰度圖中所有像素的調整后,獲得所述文字二值化圖片。
4.根據權利要求2所述的智能識別圖片文字的方法,其特征在于,所述基于預先訓練的文本切分模型,切分所述數據單圖片中的文字,獲得行文字圖片的步驟包括:
基于預先訓練的行文本切分模型,切分所述數據單圖片中的文字,獲得行文字圖片;
將所述初始文字圖片等比例縮放至預設的尺寸,獲得所述行文字圖片。
5.根據權利要求1所述的智能識別圖片文字的方法,其特征在于,所述基于所述文字圖層和預設的背景圖片生成訓練樣本的步驟包括:
基于所述數據單字符串中字符的順序拼接對應所述目標單文字圖層,獲得拼接圖層;
疊加所述拼接圖層和所述預設的背景圖片,獲得疊加圖片;
隨機對所述疊加圖片添加噪聲,獲得訓練樣本。
6.根據權利要求1所述的智能識別圖片文字的方法,其特征在于,所述初始文字識別模型包括多個不同維度的殘差塊,所述將所述訓練樣本輸入至預設的初始文字識別模型中,獲得第一文字識別結果的步驟包括:
將所述訓練樣本依次經過所述不同維度的殘差塊,融合第一維度殘差塊、第二維度的殘差塊、第三維度殘差塊和第四維度殘差塊所輸出的特征,獲得第一文字識別結果。
7.根據權利要求1所述的智能識別圖片文字的方法,其特征在于,所述標注所述單文字圖層,生成目標單文字圖層的步驟包括:
將所述單文字圖層縮放至預設的尺寸,獲得縮放后的單文字圖層;
向用戶終端輸出請求標注文字的信號;
當接收到所述用戶終端發送的目標標注的信號時,基于所述目標標注的信號生成所述目標單文字圖層,其中,所述請求標注文字的信號與所述目標標注的信號相對應。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安普惠企業管理有限公司,未經平安普惠企業管理有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011590830.6/1.html,轉載請聲明來源鉆瓜專利網。





