[發明專利]一種文本檢測模型的訓練方法、裝置和電子設備在審
| 申請號: | 202210023103.4 | 申請日: | 2022-01-10 |
| 公開(公告)號: | CN114359927A | 公開(公告)日: | 2022-04-15 |
| 發明(設計)人: | 黃健;周濤;史治國 | 申請(專利權)人: | 上海億保健康管理有限公司;浙江大學 |
| 主分類號: | G06V30/40 | 分類號: | G06V30/40;G06V30/148;G06K9/62 |
| 代理公司: | 北京超凡志成知識產權代理事務所(普通合伙) 11371 | 代理人: | 李丙林 |
| 地址: | 201800 上海市嘉定區滬宜公*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 文本 檢測 模型 訓練 方法 裝置 電子設備 | ||
1.一種文本檢測模型的訓練方法,其特征在于,待訓練文本檢測模型包括可微分二值化處理模塊,所述方法包括:
利用待訓練文本檢測模型對目標樣本圖像進行處理,以獲取所述目標樣本圖像的概率圖和自適應閾值圖;
通過所述待訓練文本檢測模型中的可微分二值化處理模塊,利用所述自適應閾值圖中各個像素點的像素值,分別對所述概率圖中各個像素點的像素值進行可微分二值化處理,以得到近似二值化特征圖;
將所述近似二值化特征圖作為反饋,用于對所述待訓練文本檢測模型進行訓練。
2.根據權利要求1所述的方法,其特征在于,所述待訓練文本檢測模型,還包括:特征提取模塊、概率圖生成模塊和自適應閾值圖生成模塊;所述目標樣本圖像設置有概率圖訓練標簽和閾值圖訓練標簽;則,
利用待訓練文本檢測模型對目標樣本圖像進行處理,以得到概率圖和自適應閾值圖,具體包括:
所述特征提取模塊提取所述目標樣本圖像的圖像特征;
所述概率圖生成模塊利用所述圖像特征以及所述概率圖訓練標簽,生成所述概率圖;以及,
所述自適應閾值圖生成模塊利用所述圖像特征以及所述閾值圖訓練標簽,生成所述自適應閾值圖。
3.根據權利要求2所述的方法,其特征在于,所述特征提取模塊具體包括:
上采樣特征提取模塊;或,
下采樣特征提取模塊。
4.根據權利要求1所述的方法,其特征在于,利用所述自適應閾值圖中各個像素點的像素值,分別對所述概率圖中各個像素點的像素值進行可微分二值化處理,以得到近似二值化特征圖,具體包括:
所述自適應閾值圖、所述概率圖和所述近似二值化特征圖中對應像素點的像素值滿足下述公式:
其中,i和j均為正整數;Bi,j為所述近似近似二值化特征圖中,坐標為(i,j)位置的像素點的像素值;Pi,j為所述概率圖中,坐標為(i,j)位置的像素點的像素值;Ti,j為所述自適應閾值圖中,坐標為(i,j)位置的像素點的像素值;k為預設常數。
5.根據權利要求1所述的方法,其特征在于,將所述近似二值化特征圖作為反饋,用于對所述待訓練文本檢測模型進行訓練,具體包括:
確定所述近似二值化特征圖的損失函數值,并利用所述損失函數值的反向傳播所計算出的梯度,對所述待訓練文本檢測模型進行訓練。
6.根據權利要求1所述的方法,其特征在于,所述方法還包括:利用訓練所得到的文本檢測模型,對待檢測圖像中的文本進行檢測。
7.根據權利要求6所述的方法,其特征在于,所述方法還包括:在所檢測到的文本的邊緣設置文本框。
8.根據權利要求6所述的方法,其特征在于,所述方法還包括:根據所檢測到的文本的文本內容,對所述文本設置分類標簽。
9.一種文本檢測模型的訓練裝置,其特征在于,待訓練文本檢測模型包括可微分二值化處理模塊,所述裝置包括:
第一處理單元,用于利用待訓練文本檢測模型對目標樣本圖像進行處理,以獲取所述目標樣本圖像的概率圖和自適應閾值圖;
二值化處理單元,用于通過所述待訓練文本檢測模型中的可微分二值化處理模塊,利用所述自適應閾值圖中各個像素點的像素值,分別對所述概率圖中各個像素點的像素值進行可微分二值化處理,以得到近似二值化特征圖;
反饋單元,用于將所述近似二值化特征圖作為反饋,用于對所述待訓練文本檢測模型進行訓練。
10.一種電子設備,其特征在于,包括:
存儲器,用以存儲計算機程序;
處理器,用以執行如權利要求1至8中任一項所述的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海億保健康管理有限公司;浙江大學,未經上海億保健康管理有限公司;浙江大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210023103.4/1.html,轉載請聲明來源鉆瓜專利網。





