[發明專利]文本檢測方法及裝置、電子設備和存儲介質在審
| 申請號: | 202011185740.9 | 申請日: | 2020-10-29 |
| 公開(公告)號: | CN112200202A | 公開(公告)日: | 2021-01-08 |
| 發明(設計)人: | 畢研廣;胡志強 | 申請(專利權)人: | 上海商湯智能科技有限公司 |
| 主分類號: | G06K9/46 | 分類號: | G06K9/46 |
| 代理公司: | 北京林達劉知識產權代理事務所(普通合伙) 11277 | 代理人: | 劉新宇 |
| 地址: | 200233 上海市徐*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文本 檢測 方法 裝置 電子設備 存儲 介質 | ||
本公開涉及一種文本檢測方法及裝置、電子設備和存儲介質,所述方法包括:通過對待檢測圖像進行目標檢測,得到所述待檢測圖像中的多個文本行,其中,各所述文本行中包括多個文字邊界點;針對任一所述文本行,通過對所述文本行中包括的所述多個文字邊界點進行線性擬合,得到所述文本行對應的目標邊界框。本公開實施例可實現提高對待檢測圖像進行文本檢測的檢測精度。
技術領域
本公開涉及計算機視覺技術領域,尤其涉及一種文本檢測方法及裝置、電子設備和存儲介質。
背景技術
光學字符識別(OCR,Optical Character Recognition)是計算機視覺的重要研究方向,其目標是從圖像數據中識別出文字。OCR識別通常包含兩步操作,第一步為文本檢測,即檢測圖像數據中文本所在區域,第二步為文字識別,即識別文本所在區域內的文字。文本檢測是OCR識別的基礎,因此,準確高效的文本檢測是OCR識別的關鍵。
發明內容
本公開提出了一種文本檢測方法及裝置、電子設備和存儲介質的技術方案。
根據本公開的一方面,提供了一種文本檢測方法,包括:通過對待檢測圖像進行目標檢測,得到所述待檢測圖像中的多個文本行,其中,各所述文本行中包括多個文字邊界點;針對任一所述文本行,通過對所述文本行中包括的所述多個文字邊界點進行線性擬合,得到所述文本行對應的目標邊界框。
在一種可能的實現方式中,所述通過對待檢測圖像進行目標檢測,得到所述待檢測圖像中的多個文本行,包括:通過對所述待檢測圖像進行目標檢測,確定所述待檢測圖像中多個文字在豎直方向上的位置;根據所述多個文字在豎直方向上的位置,確定所述多個文本行。
在一種可能的實現方式中,所述通過對所述待檢測圖像進行目標檢測,確定所述待檢測圖像中多個文字在豎直方向上的位置,包括:利用無錨框目標檢測網絡對所述待檢測圖像進行目標檢測,確定所述待檢測圖像中的多個豎直線段,其中,各所述豎直線段的上、下端點用于指示文字在豎直方向上的上、下文字邊界點;所述根據所述多個文字在豎直方向上的位置,確定所述多個文本行,包括:根據相鄰所述豎直線段之間的距離,和/或,相鄰所述豎直線段在豎直方向上的偏移程度,確定所述多個文本行,其中,各所述文本行中包括多個所述豎直線段。
在一種可能的實現方式中,同一所述文本行中包括的多個所述豎直線段中,相鄰所述豎直線段之間的距離小于等于第一閾值;同一所述文本行中包括的多個所述豎直線段中,相鄰所述豎直線段在豎直方向上的偏移程度小于等于第二閾值。
在一種可能的實現方式中,所述針對任一所述文本行,通過對所述文本行中包括的所述多個文字邊界點進行線性擬合,得到所述文本行對應的目標邊界框,包括:對所述文本行中包括的所述多個文字邊界點進行線性擬合,得到擬合邊界線,其中,所述擬合邊界線對應的擬合殘差小于等于第三閾值,所述擬合邊界線包括上擬合邊界線和下擬合邊界線;根據所述擬合邊界線,確定所述目標邊界框。
在一種可能的實現方式中,所述對所述文本行中包括的所述多個文字邊界點進行線性擬合,得到擬合邊界線,包括:對所述多個文字邊界點進行直線擬合,得到第一擬合直線;在所述第一擬合直線對應的擬合殘差小于等于所述第三閾值的情況下,將所述第一擬合直線確定為所述擬合邊界線。
在一種可能的實現方式中,所述方法還包括:在所述第一擬合直線對應的擬合殘差大于所述第三閾值的情況下,確定所述多個文字邊界點中是否存在拐點,其中,分別對所述拐點兩側的其它文字邊界點進行直線擬合得到的第二擬合直線和第二擬合直線,對應的擬合殘差均小于等于所述第三閾值;在存在所述拐點的情況下,根據所述第二擬合直線和所述第三擬合直線,確定所述擬合邊界線;在不存在所述拐點的情況下,對所述多個文字邊界點進行曲線擬合,得到擬合曲線,以及將所述擬合曲線確定為所述擬合邊界線。
在一種可能的實現方式中,所述方法還包括:根據所述多個文本行對應的所述目標邊界框,對所述多個文本行進行文字識別。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海商湯智能科技有限公司,未經上海商湯智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011185740.9/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種關節臼窩銼刀
- 下一篇:一種用于旋壓機的仿形缸底座





