[發明專利]一種文本分割方法、系統、設備以及介質有效
| 申請號: | 202011180292.3 | 申請日: | 2020-10-29 |
| 公開(公告)號: | CN112287938B | 公開(公告)日: | 2022-12-06 |
| 發明(設計)人: | 孫紅巖 | 申請(專利權)人: | 蘇州浪潮智能科技有限公司 |
| 主分類號: | G06V10/26 | 分類號: | G06V10/26;G06V30/148;G06V10/774 |
| 代理公司: | 北京連和連知識產權代理有限公司 11278 | 代理人: | 劉小峰;楊帆 |
| 地址: | 215100 江蘇省蘇州市吳*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 文本 分割 方法 系統 設備 以及 介質 | ||
本發明公開了一種文本分割方法,包括以下步驟:構建目標圖像集、源圖像集、生成器和判別器;將目標圖像集中的目標圖像和源圖像集中的源圖像輸入到生成器中,并利用生成器輸出的數據訓練判別器;響應于判別器訓練完成,將目標圖像集中的目標圖像經過生成器輸入到訓練完成的判別器,以得到訓練完成的判別器輸出的數據;利用訓練完成的判別器輸出的數據訓練生成器;響應于生成器訓練完成,利用訓練完成的生成器對輸入的圖像進行推理以得到輸入的圖像的文本分割結果。本發明還公開了一種系統、計算機設備以及可讀存儲介質。本發明提出的方案能夠讓自動合成數據訓練出來的文本分割模型可以在現實場景中達到和訓練時一樣的精度。
技術領域
本發明涉及文本識別領域,具體涉及一種文本分割方法、系統、設備以及存儲介質。
背景技術
光學字符識別(Optical Character Recognition,OCR)傳統上指對輸入掃描文檔圖像進行分析處理,識別出圖像中文字信息。
對于OCR文本定位,目前的發展方向主要有兩個方向,分別是對文本框的檢測和文本框的分割。文本框的檢測主要方法有fast-RCNN、SSD等方法,特點是處理速度快,對文本的多方向和正規文本檢測有很高的的效率和精度,缺點是對彎曲文本檢測效率不高。文本框的分割主要方法有pixelink、seglink等方法,特點是對彎曲文本有一定的檢測精度,對文本的多方向和正規文本檢測也有很高的效率和精度,缺點是運行的效率不及文本框的檢測。而對于文本定位的數據集,分為規則數據集和不規則數據集。規則數據集包括IIIT5K-Words(IIIT)、Street View Text(SVT)等,其中規則數據集文本框標注清楚,且不存在模糊等現象。對于不規則數據集,則有ICDAR2015、SVT Perspective、CUTE80等數據集,有些圖片由于拍攝角度和拍攝人員移動的關系,導致圖片文本模糊不清,在文本分割中,由于OCR的數據集拍攝的圖片數量不多、人工標注難度大且不精確等因素,因此經常需要自動合成數據集來進行訓練,而自動合成數據集的圖像往往很難達到不規則數據集那種模糊文本的效果,因此在訓練后應用到現實場景中難免會導致精度較訓練時精度有部分損失的現象。因此可以使用自動生成數據集的方法可以生成圖像文本并進行訓練,通過這種方式可以達到非監督訓練OCR的目的,但是由于其標注的特殊性,帶來了自動合成數據集和真實環境中的文本不相符的現象,從而導致在真實場景使用OCR時精度會出現部分損失較訓練時精度。
由此可見,現有的基于自動生成數據集的方法訓練OCR,可以達到非監督訓練OCR的目的,但是自動合成的數據由于其具有較高的規則性,因此,處于文本邊緣區域的像素對應的感受野的概率分布比較尖銳。對應較低的熵值,而在現實中,文本由于存在模糊或者噪聲等因素的影響,在文本邊緣區域具有平滑的概率分布,因此具有較高的熵值。因此自動合成數據集訓練出來的OCR模型在實際應用中精度會有所降低。
發明內容
有鑒于此,為了克服上述問題的至少一個方面,本發明實施例提出一種文本分割方法,包括以下步驟:
構建目標圖像集、源圖像集、生成器和判別器;
將所述目標圖像集中的目標圖像和源圖像集中的源圖像輸入到所述生成器中,并利用所述生成器輸出的數據訓練所述判別器;
響應于所述判別器訓練完成,將所述目標圖像集中的目標圖像經過所述生成器輸入到訓練完成的所述判別器,以得到訓練完成的所述判別器輸出的數據;
利用所述訓練完成的判別器輸出的數據訓練所述生成器;
響應于所述生成器訓練完成,利用訓練完成的所述生成器對輸入的圖像進行推理以得到所述輸入的圖像的文本分割結果。
在一些實施例中,構建目標圖像集、源圖像集,進一步包括:
將文本合成到多個不含文本的圖像中以構建源圖像集;
利用實際帶有文本的多個圖像構建目標圖像集。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于蘇州浪潮智能科技有限公司,未經蘇州浪潮智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011180292.3/2.html,轉載請聲明來源鉆瓜專利網。





