[發明專利]文本識別方法、裝置、電子設備及可讀存儲介質在審
| 申請號: | 202110013256.6 | 申請日: | 2021-01-06 |
| 公開(公告)號: | CN113537187A | 公開(公告)日: | 2021-10-22 |
| 發明(設計)人: | 王洪振;黃珊 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06K9/20 | 分類號: | G06K9/20;G06K9/46;G06K9/36;G06K9/40 |
| 代理公司: | 北京市立方律師事務所 11330 | 代理人: | 張筱寧;張海秀 |
| 地址: | 518000 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文本 識別 方法 裝置 電子設備 可讀 存儲 介質 | ||
本申請實施例提供了一種文本識別方法、裝置、電子設備及可讀存儲介質,該方法涉及人工智能技術以及云領域。該方法包括:獲取待識別文本圖像,其中,待識別文本圖像中包括曲形文本區域;提取待識別文本圖像的文本特征圖;基于文本特征圖確定待識別文本圖像中的待識別文本區域以及待識別文本區域的區域邊界信息,待識別文本區域包括曲形文本區域;根據區域邊界信息對待識別文本區域進行校正,得到矯正后的矩形文本區域;對矩形文本區域進行文字識別,得到待識別文本圖像的文本識別結果。在本申請實施例中,可以將曲形文本區域校正為矩形文本區域,降低了文本區域內的背景噪聲,提升了識別效果。
技術領域
本申請涉及圖像處理、人工智能以及大數據技術領域,具體而言,本申請涉及一種文本識別方法、裝置、電子設備及可讀存儲介質。
背景技術
OCR(Optical Character Recognition,光學字符識別)是計算機視覺領域一個重要的研究熱點問題,其中曲形文本識別是OCR中的重要應用。近年來,隨著深度學習技術的發展,基于深度學習的OCR檢測識別成為了主流趨勢。
其中,OCR技術包括檢測網絡和識別網絡兩個網絡,檢測網絡用于定位文本的位置,識別網絡用于識別文本的具體內容。現有的識別算法在對曲形文本檢測識別時,檢測網絡大都聚焦檢測單個任務,僅僅定位到曲形文本的位置,但是由于曲形文本包含的背景噪聲點過多,后續識別網絡無法提取文本,最終造成識別效果較差。
發明內容
本申請實施例提供一種文本識別方法、裝置、電子設備及可讀存儲介質,能夠提升對于圖像中曲形文本的文本識別效果。
一方面,本申請實施例提供了一種文本識別方法,該方法包括:
獲取待識別文本圖像,其中,待識別文本圖像中包括曲形文本區域;
提取待識別文本圖像的文本特征圖;
基于文本特征圖確定待識別文本圖像中的待識別文本區域以及待識別文本區域的區域邊界信息,待識別文本區域包括曲形文本區域;
根據區域邊界信息對待識別文本區域進行校正,得到矯正后的矩形文本區域;
對矩形文本區域進行文字識別,得到待識別文本圖像的文本識別結果。
另一方面,本申請實施例提供了一種文本識別裝置,該裝置包括:
圖像獲取模塊,用于獲取待識別文本圖像,其中,待處理圖像中包括曲形文本區域;
特征提取模塊,用于提取待識別文本圖像的文本特征圖;
邊界信息確定模塊,用于基于文本特征圖確定圖像中的待識別文本區域以及待識別文本區域的區域邊界信息,待識別文本區域包括曲形文本區域;
區域校正模塊,用于根據區域邊界信息對待識別文本區域進行校正,得到矯正后的矩形文本區域;
文本識別模塊,用于對矩形文本區域進行文字識別,得到待識別文本圖像的文本識別結果。
再一方面,本申請實施例提供了一種電子設備,包括處理器以及存儲器:存儲器被配置用于存儲計算機程序,計算機程序在由處理器執行時,使得處理器執行上述中的文本識別方法。
又一方面,本申請實施例提供了一種計算機可讀存儲介質,計算機可讀存儲介質用于存儲計算機程序,當計算機程序在計算機上運行時,使得計算機可以執行上述中的文本識別方法。
本申請實施例提供的技術方案帶來的有益效果是:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110013256.6/2.html,轉載請聲明來源鉆瓜專利網。





