[發明專利]文本區域檢測方法及設備在審
| 申請號: | 201911215779.8 | 申請日: | 2019-12-02 |
| 公開(公告)號: | CN111091123A | 公開(公告)日: | 2020-05-01 |
| 發明(設計)人: | 周康明;吳昊 | 申請(專利權)人: | 上海眼控科技股份有限公司 |
| 主分類號: | G06K9/32 | 分類號: | G06K9/32;G06K9/46 |
| 代理公司: | 上海百一領御專利代理事務所(普通合伙) 31243 | 代理人: | 王奎宇;甘章乖 |
| 地址: | 200030 上海市徐匯*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文本 區域 檢測 方法 設備 | ||
本申請提供了一種文本區域檢測方法及設備,能夠對需要進行文字識別的包含文本的圖像進行文本區域的角點檢測,得到相應的角點,再進一步根據得到的角點確定文本區域的預測框,從而可以對具有多個顯示方向的文本區域進行識別,提高了文本區域檢測的精度,同時對文本區域的定位更加精準,更加貼近文本字符。
技術領域
本申請涉及圖像識別領域,尤其涉及一種文本區域檢測方法及設備。
背景技術
當前,光學字符識別技術用于讓計算機自動識別圖像中包含的文本字符,作為光學字符識別的基礎,首先需要文本定位技術進行定位,即在圖像中定位到文本字符所在的區域。
定位文本區域目前多采用類似目標檢測的定位分類方法,將文本區域作為圖像中的檢測目標來進行檢測。該方法的問題在于要檢測的文本區域大多為長邊較長的矩形,寬高比分布較為極端,與通常目標檢測中目標物體差別較大,目標物體的寬高比約在1左右,因此往往不能很好地檢測出文本區域。另外,通常目標檢測中的目標物體存在明顯的閉合邊緣輪廓,而文本區域并不存在明顯的閉合邊緣,從而導致使用現有目標檢測方案對文本區域的圖像特征進行提取時難以將文本字符與圖像背景區分開來。
發明內容
本申請的一個目的是提供一種文本區域檢測方法及設備,用于解決現有技術下文本區域檢測的識別精度不高、定位效果不佳的問題。
為實現上述目的,本申請提供了一種文本區域檢測方法,其中,該方法包括:
構建文本區域檢測模型,其中,所述文本區域檢測模型通過角點檢測確定角點并根據所述角點確定文本區域預測框;
根據所述文本區域檢測模型對待檢測文本圖像進行文本區域檢測,確定相應的文本區域預測框,其中,所述文本區域具有不同的顯示方向。
進一步地,構建文本區域檢測模型,包括:
對樣本文本圖像進行特征提取,獲取對應的特征圖像;
對所述特征圖像進行角點檢測,確定所述樣本文本圖像中的角點,其中,所述角點的類型包括所述文本區域預測框的左上角點、右上角點、左下角點和右下角點;
對所述角點進行分類組合,根據分類組合結果確定文本區域預測框;
確定所述文本區域預測框與預先標注的文本區域識別框之間的差距,根據所述差距調整文本區域檢測模型的參數;
在滿足預設的模型訓練停止條件時,將文本區域檢測模型的當前參數確定為所述文本區域檢測模型的最終參數。
進一步地,對樣本文本圖像進行特征提取,獲取對應的特征圖像,包括:
將樣本文本圖像輸入堆疊的多個沙漏網絡,獲取所述多個沙漏網絡輸出的特征圖像,其中,所述沙漏網絡包括卷積層、池化層、下采樣層和上采樣層。
進一步地,對所述特征圖像進行角點檢測,確定所述樣本文本圖像中的角點,包括:
對特征圖像進行卷積操作,獲取卷積后特征圖像;
對所述卷積后特征圖像進行池化操作,獲取對應不同類型角點的池化后特征圖像;
根據所述對應不同類型角點的池化后特征圖像,生成對應不同類型角點的熱力圖;
將所述對應不同類型角點的熱力圖中相應類型角點的激活響應超過預設閾值的位置確定為相應類型角點的位置;
根據所述對應不同類型角點的池化后的特征圖像,確定相應類型角點對應的角點方向;
根據預設損失函數計算所述相應類型角點與預先標注的相應類型角點的信息差距,并根據預設優化方法對所述信息差距進行優化,確定優化后的相應類型角點。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海眼控科技股份有限公司,未經上海眼控科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911215779.8/2.html,轉載請聲明來源鉆瓜專利網。





