[發明專利]一種圖文處理方法、系統以及計算機可讀存儲介質在審

申請號：	202010268468.4	申請日：	2020-04-08
公開（公告）號：	CN111444876A	公開（公告）日：	2020-07-24
發明（設計）人：	陶民澤	申請（專利權）人：	證通股份有限公司
主分類號：	G06K9/00	分類號：	G06K9/00;G06K9/32;G06K9/62;G06N3/04;G06N3/08
代理公司：	中國專利代理(香港)有限公司 72001	代理人：	俞華梁;姜冰
地址：	200127 上海市浦東新***	國省代碼：	上海;31
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	一種圖文處理方法系統以及計算機可讀存儲介質
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

本發明涉及一種圖文處理方法，包括如下步驟：獲取圖文混排文件的圖像，并對所述圖像進行預處理；通過第一神經網絡將經預處理的圖像進行區域劃分；通過第二神經網絡確定劃分后的圖像中的文本區域；以及通過第三神經網絡對所述文本區域進行文本識別。

技術領域

本發明涉及一種處理圖文混排文件的機制，具體而言，涉及一種圖文處理方法、系統以及計算機可讀存儲介質。

背景技術

在進行數據采集時有時需要對圖文混排的文件進行內容識別，例如，為了收集身份信息需要對身份證圖像進行采集、識別。然而，傳統的識別方法在特征提取、文字區域檢測以及文本識別等諸多方面存在缺陷。

發明內容

因此，為了能夠高效準確地對圖文混排的文件進行內容識別，尤其是文字識別，本發明提供了一種處理圖文混排文件的機制，具體而言：

根據本發明的一方面，提供一種圖文處理方法，包括如下步驟：獲取圖文混排文件的圖像，并對所述圖像進行預處理；通過第一神經網絡將經預處理的圖像進行區域劃分；通過第二神經網絡確定劃分后的圖像中的文本區域；以及通過第三神經網絡對所述文本區域進行文本識別。

在本發明的一些實施例中，可選地，確定劃分后的圖像中的人像區域并進行裁剪。

在本發明的一些實施例中，可選地，所述方法還包括建立所述人像區域與識別到的文本的映射關系。

在本發明的一些實施例中，可選地，所述第一神經網絡是YOLO網絡，將經預處理的圖像輸入到YOLO網絡，利用YOLO網絡對其進行區域劃分。

在本發明的一些實施例中，可選地，所述第二神經網絡是CTPN網絡，將劃分后的圖像輸入到CTPN網絡，利用CTPN網絡確定其中的文本區域。

在本發明的一些實施例中，可選地，所述第三神經網絡是CRNN網絡，將所述文本區域輸入到CRNN網絡，利用CRNN網絡進行文本識別。

在本發明的一些實施例中，可選地，所述圖文混排文件是身份證件。

根據本發明的另一方面，提供一種計算機可讀存儲介質，所述計算機可讀存儲介質中存儲有指令，其特征在于，當所述指令由處理器執行時，使得所述處理器執行如上文所述的任意一種方法。

根據本發明的另一方面，提供一種圖文處理系統，包括：預處理單元，其配置成獲取圖文混排文件的圖像并對所述圖像進行預處理；劃分單元，其配置成通過其中的第一神經網絡將經預處理的圖像進行區域劃分；確定單元，其配置成通過其中的第二神經網絡確定劃分后的圖像中的文本區域；以及識別單元，其配置成通過其中的第三神經網絡對所述文本區域進行文本識別。

在本發明的一些實施例中，可選地，所述確定單元還配置成確定劃分后的圖像中的人像區域并進行裁剪。

在本發明的一些實施例中，可選地，所述系統還包括映射單元，其配置成建立所述人像區域與識別到的文本的映射關系。

在本發明的一些實施例中，可選地，所述第一神經網絡是YOLO網絡，YOLO網絡接收經預處理的圖像并對其進行區域劃分。

在本發明的一些實施例中，可選地，所述第二神經網絡是CTPN網絡，所述CTPN網絡接收劃分后的圖像并確定其中的文本區域。

在本發明的一些實施例中，可選地，所述第三神經網絡是CRNN網絡，所述CRNN網絡接收所述文本區域并進行文本識別。

在本發明的一些實施例中，可選地，所述圖文混排文件是身份證件。

附圖說明

從結合附圖的以下詳細說明中，將會使本發明的上述和其他目的及優點更加完整清楚，其中，相同或相似的要素采用相同的標號表示。

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于證通股份有限公司，未經證通股份有限公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/202010268468.4/2.html，轉載請聲明來源鉆瓜專利網。