[發明專利]圖像文本識別方法及裝置在審
| 申請號: | 202111676256.0 | 申請日: | 2021-12-31 |
| 公開(公告)號: | CN114332842A | 公開(公告)日: | 2022-04-12 |
| 發明(設計)人: | 范湉湉;黃燦;王長虎 | 申請(專利權)人: | 北京有竹居網絡技術有限公司 |
| 主分類號: | G06V20/62 | 分類號: | G06V20/62;G06V30/10;G06V10/44;G06V10/764;G06V10/82;G06N3/04;G06N3/08 |
| 代理公司: | 北京信遠達知識產權代理有限公司 11304 | 代理人: | 趙曉榮 |
| 地址: | 101299 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 圖像 文本 識別 方法 裝置 | ||
本申請實施例公開了一種圖像文本識別方法及裝置,將待識別圖像輸入圖像文本識別模型,獲取圖像文本識別模型輸出的識別文本字符序列。其中,啟動單元用于確定待識別圖像中按照預設排布順序排布的首個待識別文本字符所在的區域。待識別圖像包括至少兩個按照預設排布順序排布的待識別文本字符,圖像文本識別模型由編碼單元、啟動單元和解碼單元構成。基于啟動單元,圖像文本識別模型能夠學習到待識別圖像中預設排布順序中首個文本字符的相關信息,進而能夠基于首個文本字符對待識別圖像中的待識別文本字符進行識別,得到較為準確的識別文本字符序列。
技術領域
本申請涉及圖像處理領域,具體涉及一種圖像文本識別方法及裝置。
背景技術
OCR(Optical Character Recognition,光學字符識別)是對包括文本的圖像進行識別分析,得到圖像中的文本的技術。利用OCR技術,可以對圖像中的文本進行提取和識別。
圖像文本中的字符會按照一定的排布順序進行排布。通常情況下,圖像中的文本會按照水平從左到右的排布順序進行排布。此外,還有一些圖像中的文本會按照較為特殊的排布順序進行排布,例如交錯排布、縱向排布等。
目前,利用OCR技術能夠對水平從左到右的排布順序的文本進行識別,而對于特殊的排布順序的文本的識別準確度較低。
發明內容
有鑒于此,本申請實施例提供一種圖像文本識別方法及裝置,能夠對圖像中較為特殊、復雜的排布順序的文本進行較為準確地識別。
為解決上述問題,本申請實施例提供的技術方案如下:
第一方面,本申請實施例提供一種圖像文本識別方法,所述方法包括:
將待識別圖像輸入圖像文本識別模型,所述待識別圖像包括至少兩個按照預設排布順序排布的待識別文本字符,所述圖像文本識別模型由編碼單元、啟動單元和解碼單元構成,所述啟動單元用于確定所述待識別圖像中按照所述預設排布順序的首個待識別文本字符所在的區域;
獲取所述圖像文本識別模型輸出的識別文本字符序列。
第二方面,本申請實施例提供一種圖像文本識別裝置,所述裝置包括:
輸入單元,用于將待識別圖像輸入圖像文本識別模型,所述待識別圖像包括至少兩個按照預設排布順序排布的待識別文本字符,所述圖像文本識別模型由編碼單元、啟動單元和解碼單元構成,所述啟動單元用于確定所述待識別圖像中按照所述預設排布順序的首個待識別文本字符所在的區域;
獲取單元,用于獲取所述圖像文本識別模型輸出的識別文本字符序列。
第三方面,本申請實施例提供一種電子設備,包括:
一個或多個處理器;
存儲裝置,其上存儲有一個或多個程序,
當所述一個或多個程序被所述一個或多個處理器執行,使得所述一個或多個處理器實現第一方面中任一實施例所述的方法。
第四方面,本申請實施例提供一種計算機可讀介質,其特征在于,其上存儲有計算機程序,其中,所述程序被處理器執行時實現第一方面中任一實施例所述的方法。
由此可見,本申請實施例具有如下有益效果:
本申請實施例提供一種圖像文本識別方法及裝置,將待識別圖像輸入圖像文本識別模型中,獲取圖像文本識別模型輸出的識別文本字符序列。其中,圖像文本識別模型由編碼單元、啟動單元和解碼單元構成。啟動單元能夠確定待識別圖像中按照預設排布順序排布的首個待識別字符所在區域。圖像文本識別模型能夠學習到待識別圖像中預設排布順序中首個文本字符的相關信息,進而能夠基于首個文本字符對待識別圖像中的待識別文本字符進行識別,能夠對圖像中按照預設排布順序的文本字符進行較為準確地識別,得到較為準確的識別文本字符序列。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京有竹居網絡技術有限公司,未經北京有竹居網絡技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111676256.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種具有光伏發電功能的節能型建筑幕墻及其安裝方法
- 下一篇:蓄熱化霜空調系統
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





