[發明專利]圖像傾斜文本行檢測模型訓練及圖像傾斜文本行檢測方法在審
| 申請號: | 202010251711.1 | 申請日: | 2020-04-01 |
| 公開(公告)號: | CN111444918A | 公開(公告)日: | 2020-07-24 |
| 發明(設計)人: | 尚果超 | 申請(專利權)人: | 中移雄安信息通信科技有限公司;中國移動通信集團有限公司 |
| 主分類號: | G06K9/32 | 分類號: | G06K9/32;G06K9/62;G06N3/04 |
| 代理公司: | 北京東方億思知識產權代理有限責任公司 11258 | 代理人: | 彭瓊 |
| 地址: | 071700 河*** | 國省代碼: | 河北;13 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 圖像 傾斜 文本 檢測 模型 訓練 方法 | ||
1.一種圖像傾斜文本行檢測模型的訓練方法,其特征在于,包括:
獲取訓練數據集;其中,所述訓練數據集包括多個具有傾斜文本行的目標圖像;
基于所述訓練數據集,訓練基于旋轉區域的卷積神經網絡RRCNN,得到圖像傾斜文本行檢測模型;其中,所述RRCNN包括旋轉區域提議網絡RRPN結構,所述RRPN結構用于生成各個所述目標圖像的所述傾斜文本行對應的附帶傾斜角度的文本行候選框。
2.根據權利要求1所述的圖像傾斜文本行檢測模型的訓練方法,其特征在于,所述獲取訓練數據集,包括:
采集多個具有所述傾斜文本行的第一圖像;
確定各個所述第一圖像的所述傾斜文本行的數據標簽;其中,所述數據標簽包括所述傾斜文本行所屬矩形框的中心坐標、長度、寬度及傾斜角度;
綁定所述第一圖像及對應的數據標簽,得到所述目標圖像。
3.根據權利要求1所述的圖像傾斜文本行檢測模型的訓練方法,其特征在于,所述基于所述訓練數據集,訓練基于旋轉區域的卷積神經網絡RRCNN,得到圖像傾斜文本行檢測模型,包括:
提取所述訓練數據集中所述目標圖像的圖像特征,得到所述目標圖像的特征圖;
基于所述特征圖、預設尺寸比例的錨框及所述傾斜文本行的旋轉信息,確定旋轉錨框集;
基于預設的傾斜文本行檢測準確率,確定所述旋轉錨框集中的旋轉錨框正樣本和旋轉錨框負樣本;
基于所述旋轉錨框正樣本和所述旋轉錨框負樣本,訓練所述RRCNN,得到所述圖像傾斜文本行檢測模型。
4.根據權利要求3所述的圖像傾斜文本行檢測模型的訓練方法,其特征在于,所述基于所述旋轉錨框正樣本和所述旋轉錨框負樣本,訓練所述RRCNN,得到所述圖像傾斜文本行檢測模型,包括:
獲取目標損失函數;
基于所述旋轉錨框正樣本、所述旋轉錨框負樣本及所述目標損失函數,確定所述RRCNN中各層結構的權重參數;
基于所述RRCNN及所述RRCNN中各層結構的所述權重參數,得到所述圖像傾斜文本行檢測模型。
5.一種基于圖像傾斜文本行檢測模型的圖像傾斜文本行檢測方法,其特征在于,所述圖像傾斜文本行檢測模型是使用權利要求1至4任一項所述的圖像傾斜文本行檢測模型的訓練方法得到的模型,包括:
獲取待檢測圖像;
將所述待檢測圖像輸入所述圖像傾斜文本行檢測模型,輸出文本行檢測結果。
6.根據權利要求5所述的圖像傾斜文本行檢測方法,其特征在于,所述將所述待檢測圖像輸入所述圖像傾斜文本行檢測模型,輸出文本行檢測結果,包括:
提取所述待檢測圖像的圖像特征,得到所述待檢測圖像的特征圖;
基于所述特征圖、預設的多個不同尺寸比例的錨框及所述待檢測圖像中傾斜文本行的旋轉信息,確定多個不同尺寸比例的旋轉錨框;
基于任一旋轉錨框,確定所述任一旋轉錨框的文本行候選框;
針對多個所述文本行候選框進行篩選和映射,得到目標特征圖;
基于預設的激活函數,針對所述目標特征圖進行文本行檢測框的回歸和分類,輸出所述文本行檢測結果。
7.一種圖像傾斜文本行檢測模型的訓練裝置,其特征在于,包括:
獲取模塊,用于獲取訓練數據集;其中,所述訓練數據集包括多個具有傾斜文本行的目標圖像;
訓練模塊,用于基于所述訓練數據集,訓練RRCNN,得到圖像傾斜文本行檢測模型;其中,所述RRCNN包括RRPN結構,所述RRPN結構用于生成各個所述目標圖像的所述傾斜文本行對應的附帶傾斜角度的文本行候選框。
8.一種基于圖像傾斜文本行檢測模型的圖像傾斜文本行檢測裝置,其特征在于,所述圖像傾斜文本行檢測模型是使用權利要求1至4任一項所述的圖像傾斜文本行檢測模型的訓練方法得到的模型,包括:
獲取模塊,用于獲取待檢測圖像;
輸出模塊,用于將所述待檢測圖像輸入所述圖像傾斜文本行檢測模型,輸出文本行檢測結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中移雄安信息通信科技有限公司;中國移動通信集團有限公司,未經中移雄安信息通信科技有限公司;中國移動通信集團有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010251711.1/1.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





