[發明專利]一種文本檢測模型的訓練方法、裝置和電子設備在審

申請號：	202210023103.4	申請日：	2022-01-10
公開（公告）號：	CN114359927A	公開（公告）日：	2022-04-15
發明（設計）人：	黃健;周濤;史治國	申請（專利權）人：	上海億保健康管理有限公司;浙江大學
主分類號：	G06V30/40	分類號：	G06V30/40;G06V30/148;G06K9/62
代理公司：	北京超凡志成知識產權代理事務所(普通合伙) 11371	代理人：	李丙林
地址：	201800 上海市嘉定區滬宜公***	國省代碼：	上海;31
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	一種文本檢測模型訓練方法裝置電子設備
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

本申請提供一種文本檢測模型的訓練方法、裝置和電子設備。該方法包括：利用待訓練文本檢測模型對目標樣本圖像進行處理，以獲取目標樣本圖像的概率圖和自適應閾值圖；通過待訓練文本檢測模型中的可微分二值化處理模塊，利用自適應閾值圖中各個像素點的像素值，分別對概率圖中各個像素點的像素值進行可微分二值化處理，以得到近似二值化特征圖；將近似二值化特征圖作為反饋，用于對待訓練文本檢測模型進行訓練。

技術領域

本申請涉及信息處理技術領域，具體而言，涉及一種文本檢測模型的訓練方法、裝置和電子設備。

背景技術

在一些場景中，往往需要對圖像中的文字進行檢測，比如，在司法領域，需要從司法卷宗的圖像中檢測出諸如起訴意見書、鑒定報告等文字，在智能理賠領域，需要從醫療發票的圖像中檢測出諸如姓名、金額等文字。因此，需要提供針對圖像中的文本進行檢測的解決方案。

發明內容

本申請實施例的目的在于提供一種文本檢測模型的訓練方法、裝置和電子設備，用以通過訓練得到的文本檢測模型，實現對圖像中文本的檢測。

本申請實施例第一方面提供了一種文本檢測模型的訓練方法，待訓練文本檢測模型包括可微分二值化處理模塊，該方法包括：

利用待訓練文本檢測模型對目標樣本圖像進行處理，以獲取所述目標樣本圖像的概率圖和自適應閾值圖；

通過所述待訓練文本檢測模型中的可微分二值化處理模塊，利用所述自適應閾值圖中各個像素點的像素值，分別對所述概率圖中各個像素點的像素值進行可微分二值化處理，以得到近似二值化特征圖；

將所述近似二值化特征圖作為反饋，用于對所述待訓練文本檢測模型進行訓練。

于一實施例中，所述待訓練文本檢測模型，還包括：特征提取模塊、概率圖生成模塊和自適應閾值圖生成模塊；所述目標樣本圖像設置有概率圖訓練標簽和閾值圖訓練標簽；則，

利用待訓練文本檢測模型對目標樣本圖像進行處理，以得到概率圖和自適應閾值圖，具體包括：