[發明專利]文本區域檢測方法及設備在審
| 申請號: | 201911215779.8 | 申請日: | 2019-12-02 |
| 公開(公告)號: | CN111091123A | 公開(公告)日: | 2020-05-01 |
| 發明(設計)人: | 周康明;吳昊 | 申請(專利權)人: | 上海眼控科技股份有限公司 |
| 主分類號: | G06K9/32 | 分類號: | G06K9/32;G06K9/46 |
| 代理公司: | 上海百一領御專利代理事務所(普通合伙) 31243 | 代理人: | 王奎宇;甘章乖 |
| 地址: | 200030 上海市徐匯*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文本 區域 檢測 方法 設備 | ||
1.一種文本區域檢測方法,其中,該方法包括:
構建文本區域檢測模型,其中,所述文本區域檢測模型通過角點檢測確定角點并根據所述角點確定文本區域預測框;
根據所述文本區域檢測模型對待檢測文本圖像進行文本區域檢測,確定相應的文本區域預測框,其中,所述文本區域具有不同的顯示方向。
2.根據權利要求1所述的方法,其中,構建文本區域檢測模型,包括:
對樣本文本圖像進行特征提取,獲取對應的特征圖像;
對所述特征圖像進行角點檢測,確定所述樣本文本圖像中的角點,其中,所述角點的類型包括所述文本區域預測框的左上角點、右上角點、左下角點和右下角點;
對所述角點進行分類組合,根據分類組合結果確定文本區域預測框;
確定所述文本區域預測框與預先標注的文本區域識別框之間的差距,根據所述差距調整文本區域檢測模型的參數;
在滿足預設的模型訓練停止條件時,將文本區域檢測模型的當前參數確定為所述文本區域檢測模型的最終參數。
3.根據權利要求2所述的方法,其中,對樣本文本圖像進行特征提取,獲取對應的特征圖像,包括:
將樣本文本圖像輸入堆疊的多個沙漏網絡,獲取所述多個沙漏網絡輸出的特征圖像,其中,所述沙漏網絡包括卷積層、池化層、下采樣層和上采樣層。
4.根據權利要求2所述的方法,其中,對所述特征圖像進行角點檢測,確定所述樣本文本圖像中的角點,包括:
對特征圖像進行卷積操作,獲取卷積后特征圖像;
對所述卷積后特征圖像進行池化操作,獲取對應不同類型角點的池化后特征圖像;
根據所述對應不同類型角點的池化后特征圖像,生成對應不同類型角點的熱力圖;
將所述對應不同類型角點的熱力圖中相應類型角點的激活響應超過預設閾值的位置確定為相應類型角點的位置;
根據所述對應不同類型角點的池化后的特征圖像,確定相應類型角點對應的角點方向;
根據預設損失函數計算所述相應類型角點與預先標注的相應類型角點的信息差距,并根據預設優化方法對所述信息差距進行優化,確定優化后的相應類型角點。
5.根據權利要求4所述的方法,其中,所述對特征圖像進行卷積操作中所使用卷積核的大小為3×5。
6.根據權利要求4所述的方法,其中,對所述卷積后特征圖像進行池化操作,獲取對應不同類型角點的池化后特征圖像,包括:
獲取所述卷積后特征圖像中第一像素點;
遍歷與所述第一像素點屬于同一通道、同一行且位于預設水平方向上的其它像素點,將像素點的最大取值確定為水平方向最大值,所述預設水平方向根據角點類型確定;
遍歷與所述第一像素點屬于同一通道、同一列且位于預設垂直方向上的其它像素點,將像素點的最大取值確定為垂直方向最大值,所述預設垂直方向根據角點類型確定;
將所述水平方向最大值與所述垂直方向最大值之和作為對應類型角點的池化后特征圖像上第二像素點的值,所述第二像素點在所述對應類型角點的池化后特征圖像上的位置與所述第一像素點在所述卷積后特征圖像上的位置相對應。
7.根據權利要求4所述的方法,其中,根據所述對應不同類型角點的池化后的特征圖像,確定相應類型角點對應的角點方向,包括:
將所述對應不同類型角點的池化后的特征圖像輸入歸一化指數函數進行分類預測,確定相應類型角點所屬的角度分區,將所屬角度分區確定為相應類型角點對應的角點方向,所述角度分區為對周角進行角度的平均劃分所得到的多個分區。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海眼控科技股份有限公司,未經上海眼控科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911215779.8/1.html,轉載請聲明來源鉆瓜專利網。





