[發明專利]一種圖像文本檢測方法、裝置、系統及介質在審
| 申請號: | 202110118979.2 | 申請日: | 2021-01-28 |
| 公開(公告)號: | CN112883961A | 公開(公告)日: | 2021-06-01 |
| 發明(設計)人: | 李天馳;孫悅;王帥 | 申請(專利權)人: | 深圳點貓科技有限公司 |
| 主分類號: | G06K9/32 | 分類號: | G06K9/32 |
| 代理公司: | 廣東良馬律師事務所 44395 | 代理人: | 張柯 |
| 地址: | 518000 廣東省深圳市前海深港合作區南山街道興海大道3044號信*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 圖像 文本 檢測 方法 裝置 系統 介質 | ||
本發明公開了一種圖像文本檢測方法、裝置、系統及介質,方法包括:獲取待檢測文本圖像,對所述待檢測文本圖像進行特征提取后輸出共享文本特征圖;根據所述共享文本特征圖迭代生成覆蓋所述共享文本特征圖中全部文本區域的全覆蓋文本候選框;根據所述全覆蓋文本候選框估計所述共享文本特征圖中全部文本區域的幾何屬性,并根據所述幾何屬性輸出全部文本區域的文本定位檢測結果。本發明實施例通過在提取共享文本特征圖后通過迭代處理生成全覆蓋的文本候選框,可滿足任意形狀和長文本的檢測需求,有效提高了不規則文本圖像的檢測準確性。
技術領域
本發明涉及文本檢測技術領域,尤其涉及一種圖像文本檢測方法、裝置、系統及介質。
背景技術
場景文本檢測由于其無處不在的現實應用,如場景理解、產品搜索和自動駕駛等,已經引起了學術界和工業界的廣泛關注。文本檢測是文本識別的前提,其質量將極大地影響文本識別的性能。
最近隨著卷積神經網絡的興起,一般的目標檢測算法都取得了良好的性能。然而,由于場景文本的特定屬性,例如在顏色、比例、方向、縱橫比和形狀與一般對象明顯不同,其中形狀和長度對文本檢測準確性影響較大,常用的卷積神經網絡很難泛化性的檢測到所有形狀的文本,且過長的文本實例的大小遠遠超出檢測器的文本接受域,無法編碼足夠的信息來捕獲長時間的依賴關系,導致場景文本檢測的準確性大大降低。
因此,現有技術還有待于改進和發展。
發明內容
鑒于上述現有技術的不足,本發明的目的在于提供一種圖像文本檢測方法、裝置、系統及介質,旨在解決現有技術中場景文本檢測準確性低的問題。
本發明的技術方案如下:
一種圖像文本檢測方法,其包括如下步驟:
獲取待檢測文本圖像,對所述待檢測文本圖像進行特征提取后輸出共享文本特征圖;
根據所述共享文本特征圖迭代生成覆蓋所述共享文本特征圖中全部文本區域的全覆蓋文本候選框;
根據所述全覆蓋文本候選框估計所述共享文本特征圖中全部文本區域的幾何屬性,并根據所述幾何屬性輸出全部文本區域的文本定位檢測結果。
所述的圖像文本檢測方法中,所述對所述待檢測文本圖像進行特征提取后輸出共享文本特征圖,包括:
將所述待檢測文本圖像輸入至具有殘差模塊的特征提取網絡中;
通過所述具有殘差模塊的特征提取網絡對所述待檢測文本圖像進行多次下采樣與特征融合后輸出共享文本特征圖。
所述的圖像文本檢測方法中,所述通過所述具有殘差模塊的特征提取網絡對所述待檢測文本圖像進行多次下采樣與特征融合后輸出共享文本特征圖,具體包括:
通過所述具有殘差模塊的特征提取網絡對所述待檢測文本圖像進行多次下采樣,每次下采樣均經過預設大小的卷積核進行卷積運算,得到具有最小核值的共享文本特征圖。
所述的圖像文本檢測方法中,所述根據所述共享文本特征圖迭代生成覆蓋所述共享文本特征圖中全部文本區域的全覆蓋文本候選框,包括:
對所述共享文本特征圖進行文本候選框預測后輸出初級文本候選框;
對所述初級文本候選框進行迭代優化處理后輸出覆蓋所述共享文本特征圖中全部文本區域的全覆蓋文本候選框。
所述的圖像文本檢測方法中,所述對所述初級文本候選框進行迭代優化處理后輸出覆蓋所述共享文本特征圖中全部文本區域的全覆蓋文本候選框,包括:
對所述初級文本候選框進行感興趣區域轉換后獲得所述初級文本候選框對應的特征塊;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳點貓科技有限公司,未經深圳點貓科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110118979.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種無源耐溫抗菌阻垢防臘防腐蝕組件
- 下一篇:新風控制方法、裝置及空調器
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





