[發明專利]文字識別網絡訓練方法、裝置、計算機設備及存儲介質在審
| 申請號: | 202110997813.2 | 申請日: | 2021-08-27 |
| 公開(公告)號: | CN113705568A | 公開(公告)日: | 2021-11-26 |
| 發明(設計)人: | 張正夫;梁鼎;吳一超 | 申請(專利權)人: | 深圳市商湯科技有限公司 |
| 主分類號: | G06K9/32 | 分類號: | G06K9/32;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京中知恒瑞知識產權代理事務所(普通合伙) 11889 | 代理人: | 袁忠林 |
| 地址: | 518000 廣東省深圳市*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文字 識別 網絡 訓練 方法 裝置 計算機 設備 存儲 介質 | ||
本公開提供了一種文字識別網絡訓練方法、裝置、計算機設備及存儲介質,包括:獲取帶有文字的樣本圖像集,其中,所述樣本圖像集中包括對應有正確文本標注信息和易混淆文本標注信息的第一樣本圖像;基于待訓練的第一文字識別網絡,確定所述第一樣本圖像對應的預測文本內容;基于所述正確文本標注信息和所述預測文本內容,確定以所述正確文本標注信息為監督信息時的第一損失值;以及基于所述易混淆文本標注信息和所述預測文本內容,確定以所述易混淆文本標注信息為監督信息時的第二損失值;基于所述第一損失值和所述第二損失值,訓練所述待訓練的第一文字識別網絡。
技術領域
本公開涉及神經網絡技術領域,具體而言,涉及一種文字識別網絡訓練方法、裝置、計算機設備及存儲介質。
背景技術
相關技術中,在訓練第一文字識別網絡時,一般是為帶有文字的樣本圖像添加標注信息,該標注信息用于表示樣本圖像中帶有的文字內容,然后將樣本圖像輸入至第一文字識別網絡中,再基于第一文字識別網絡的輸出和標注信息,對第一文字識別網絡進行訓練。
然而由于部分文字之間相似性太高,例如字母“O”和數字“0”,因此基于這種方法訓練出的第一文字識別網絡對于這些易混淆的文字的識別精度較低。
發明內容
本公開實施例至少提供一種文字識別網絡訓練方法、裝置、計算機設備及存儲介質。
第一方面,本公開實施例提供了一種文字識別網絡訓練方法,包括:
獲取帶有文字的樣本圖像集,其中,所述樣本圖像集中包括對應有正確文本標注信息和易混淆文本標注信息的第一樣本圖像;
基于待訓練的第一文字識別網絡,確定所述第一樣本圖像對應的預測文本內容;
基于所述正確文本標注信息和所述預測文本內容,確定以所述正確文本標注信息為監督信息時的第一損失值;以及基于所述易混淆文本標注信息和所述預測文本內容,確定以所述易混淆文本標注信息為監督信息時的第二損失值;
基于所述第一損失值和所述第二損失值,訓練所述待訓練的第一文字識別網絡。
通過上述方法,分別將第一樣本圖像的正確文本標注信息和易混淆文本標注信息作為監督數據,計算訓練過程中的第一損失值和第二損失值,然后基于第一損失值和第二損失值,訓練第一文字識別網絡,這樣由于第一文字識別網絡在訓練過程中使用的第一樣本圖像添加了易混淆文本標注信息,因此第一文字識別網絡能夠提升對于易混淆文本的識別能力,也即這種訓練方法提升了第一文字識別網絡的網絡精度。
一種可能的實施方式中,所述方法還包括根據以下方法確定所述樣本圖像集中的第一樣本圖像以及所述第一樣本圖像對應的易混淆文本標注信息:
將所述樣本圖像集中的目標樣本圖像輸入至預先訓練的第二文字識別網絡中,確定所述目標樣本圖像對應的預測文本內容;其中,所述第二文字識別網絡是基于所述樣本圖像集中的樣本圖像和所述樣本圖像對應的正確文本標注信息訓練得到的;
在基于所述目標樣本圖像的所述正確文本標注信息檢測到,所述目標樣本圖像對應的預測文本內容中存在錯誤文本內容的情況下,將所述目標樣本圖像作為所述第一樣本圖像,將所述目標樣本圖像的預測文本內容作為所述第一樣本圖像的易混淆文本標注信息。
這樣通過第二文字識別網絡確定第一樣本圖像和易混淆文本標注信息,可以提升第一樣本圖像標注的效率和精度,避免人工再去對第一樣本圖像進行標注。
一種可能的實施方式中,所述待訓練的第一文字識別網絡為預先訓練的第二文字識別網絡,所述第二文字識別網絡用于生成所述第一樣本圖像的易混淆文本標注信息。
直接在已經訓練好的第二文字識別網絡的基礎上,再基于第一樣本圖像對第二文字識別網絡進行訓練,可以提升網絡的訓練速度。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳市商湯科技有限公司,未經深圳市商湯科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110997813.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:電池內部溫度的估算方法
- 下一篇:電池包加熱時間的估算方法





