[發明專利]一種文本檢測方法、裝置、設備及存儲介質在審
| 申請號: | 202210429576.4 | 申請日: | 2022-04-22 |
| 公開(公告)號: | CN114926849A | 公開(公告)日: | 2022-08-19 |
| 發明(設計)人: | 周源贛;章水鑫 | 申請(專利權)人: | 南京三百云信息科技有限公司 |
| 主分類號: | G06V30/412 | 分類號: | G06V30/412;G06N3/04;G06N3/08;G06V10/25;G06V10/44;G06V10/774;G06V10/80;G06V10/82 |
| 代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 郭德霞 |
| 地址: | 210000 江蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 文本 檢測 方法 裝置 設備 存儲 介質 | ||
本發明公開了一種文本檢測方法、裝置、設備及存儲介質。該方法包括:獲取待檢測圖像;將待檢測圖像輸入至預先構建的內縮偏移文本檢測模型,確定目標語義分割特征圖和目標偏移量特征圖;根據目標語義分割特征圖和目標偏移量特征圖確定目標外擴距離和待外擴矩形框;將待外擴矩形框外擴目標外擴距離,確定目標文本檢測框;其中,預先構建的內縮偏移文本檢測模型包括語義分割子模型和偏移量回歸子模型。本發明實施例的技術方案,解決了現有依據內縮文本實例訓練所得的文本檢測模型不考慮文本內縮過程偏移量,導致對密集文本區域進行檢測時,檢測速度慢且效果較差的問題,減少了目標文本檢測框的確定計算量,提升了文本檢測效率。
技術領域
本發明涉及圖像處理技術領域,尤其涉及一種文本檢測方法、裝置、設備及存儲介質。
背景技術
文本檢測應用范圍廣泛,是很多計算機視覺任務的前置步驟,如圖像搜索、文字識別、身份認證和視覺導航等。文本檢測的目的主要是定位文本行在圖像中的位置,然而在自然場景中,文本行的大小、字體、顏色、形狀、方向和背景存在多樣性,在識別過程中常發生粘連。隨著深度學習的興起,對文本檢測的研究逐漸成為熱點,出現了大量關于文本檢測的方法。
在自然文本檢測場景中,基于語義分割的文本檢測算法通常使用內縮文本實例來生成文本實例互相分離的掩膜來作為真實樣本,目前使用這一思想來進行文本檢測的算法有EAST和PSENet等,其通過多邊形內縮算法將標注好的真實樣本框處理成內縮后的樣本框,以此將密集粘連的文本實例分開,方便神經網絡學習到分離后的特征。
然而,采用上述算法學習內縮后的樣本后,EAST算法是在內縮區域的掩膜位置上直接回歸四邊形的集合距離,以此來定位文本實例;而PSENet算法則是在多個不同內縮偏移的掩膜上從內到外進行擴張得到精準的掩膜,再計算掩膜的包圍盒得到文本實例的定位,二者均未對內縮樣本框生成過程中可能產生的偏移量進行考慮,使得應用于密集文本區域檢測時,檢測速度慢且檢測效果較差,影響了文本檢測的效率。
發明內容
本發明提供了一種文本檢測方法、裝置、設備及存儲介質,對內縮偏移的場景文本進行學習和檢測,提升了文本檢測的效率和準確性,平衡了文本檢測所需的精度和速度。
第一方面,本發明實施例提供了一種文本檢測方法,包括:
獲取待檢測圖像;
將待檢測圖像輸入至預先構建的內縮偏移文本檢測模型,確定目標語義分割特征圖和目標偏移量特征圖;
根據目標語義分割特征圖和目標偏移量特征圖確定目標外擴距離和待外擴矩形框;
將待外擴矩形框外擴目標外擴距離,確定目標文本檢測框;
其中,預先構建的內縮偏移文本檢測模型包括語義分割子模型和偏移量回歸子模型。
進一步地,內縮偏移文本檢測模型的訓練步驟包括:
將內縮偏移文本訓練樣本集中的圖像樣本集進行基礎特征提取,確定基礎特征樣本集;其中,內縮偏移文本訓練樣本集中包括圖像樣本集以及與圖像樣本集對應的標定樣本集,標定樣本集中包括與各圖像樣本對應的內縮分割標簽和偏移量標簽;
將基礎特征樣本集輸入至初始語義分割子模型,提取語義分割中間結果;
將基礎特征樣本集輸入至初始偏移量回歸子模型,提取偏移量中間結果;
根據語義分割中間結果和對應的內縮分割標簽,確定對應的第一損失函數;
根據偏移量中間結果和對應的偏移量標簽,確定對應的第二損失函數;
根據第一損失函數和第二損失函數確定總損失函數,并基于總損失函數對初始語義分割子模型和初始偏移量回歸子模型進行訓練,直到滿足預設收斂條件獲得內縮偏移文本檢測模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京三百云信息科技有限公司,未經南京三百云信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210429576.4/2.html,轉載請聲明來源鉆瓜專利網。





