[發明專利]圖片文字識別方法、裝置及平臺在審
| 申請號: | 201910106685.0 | 申請日: | 2019-02-02 |
| 公開(公告)號: | CN109919146A | 公開(公告)日: | 2019-06-21 |
| 發明(設計)人: | 周釗;鄭瑩斌;葉浩 | 申請(專利權)人: | 上海兌觀信息科技技術有限公司 |
| 主分類號: | G06K9/20 | 分類號: | G06K9/20;G06K9/34;G06K9/62;G06N3/04 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 201404 上海市奉*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文字信息 區域提取 子區域 局部分割 拼接處理 圖片文字 拼接 圖片分割 圖片區域 合并 全局 分割 | ||
一種圖片文字識別方法,包括:局部分割,將包含有文字信息的圖片分割為多個區域,判斷每個區域是否含有文字信息,對于包含有文字信息的區域提取其中的文字信息;全局連接,將包含有文字信息的區域進行拼接處理,根據拼接合并后的區域提取識別出其中的文字信息。在局部分割步驟中,將所述的圖片區域再進一步分割,生成多個子區域,判斷每個子區域是否含有文字信息,對于包含有文字信息的子區域提取其中的文字信息;在全局連接步驟中,將包含有文字信息的子區域進行拼接處理,根據拼接合并后的區域提取識別出其中的文字信息。
技術領域
本發明屬于圖像處理技術領域,特別涉及一種圖片文字識別方法、裝置及平臺。
背景技術
現有的對圖片中包含的文本文字的提取識別,通常會使用到OCR。光學字符識別技術(OCR),是通過掃描、攝影等光學輸入方式將各種票據、報刊、書籍、文稿及其它印刷品的文字轉化為圖像信息,再利用文字識別技術將圖像信息轉化為可以使用的計算機輸入技術。可應用于銀行票據、大量文字資料、檔案卷宗、文案的錄入和處理領域。適合于銀行、稅務等行業大量票據表格的自動掃描識別及長期存儲。相對一般文本,通常以最終識別率、識別速度、版面理解正確率及版面還原滿意度4個方面作為OCR技術的評測依據;而相對于表格及票據,通常以識別率或整張通過率及識別速度為測定OCR技術的實用標準。
OCR中通常還包括字符檢測和字符識別。其中字符檢測技術,通過一些圖像處理的方法,獲取文字邊緣,形狀等特征,從而獲取文字的區域。目前的技術都是通過深度學習的方法,利用深度神經網絡獲取文字的特征,然后通過預先定義的基礎文字框進行分類,回歸或者直接分割的方法確定文字的區域。字符識別技術,當前的技術是通過深度學習的方法,利用循環神經網絡獲取圖像的連續特征,然后通過分類的方式確定每個識別塊的文字。
如圖1所示的文字識別方法,首先通過傳統的圖像處理的方法對輸入的圖像進行二值化處理,然后根據文字的特征進行模糊處理,最后用區域檢測算法標定出文字的區域,然后送入到識別網絡中進行圖像的處理。該技術簡單,效率高,占用的計算資源較少。但是這種方法的缺點是,對輸入圖像的要求較高,只能處理文字大小相近且直線排列的文字,不能處理任意形狀的文字。這里的任意形狀文字,是由于很多圖片中的文字,由于藝術美化的需要,采用了變體文字的表現形式,不僅包括常用字體,還包括又各種夸張變形的字體,給文字的自動識別帶來困難。
又,例如圖2所示的文字識別方法,借鑒通用圖像物體檢測的思路(如Faster-RCNN),采用深度神經網絡提取文字的特征,然后根據這些特征判斷預先設定好基礎的文本框(通常為不同長寬比的矩形)是否存在文字以及文字區域的偏移量,從而確定文字的區域。之后送入到識別網絡中,獲取文字信息。該方法的缺點是,對于圖像中可能存在的長文字區域比較容易檢測不準確,位置信息不夠精準,不能解決彎曲字體的識別。
發明內容
本發明實施例提供了一種圖片文字識別方法及裝置,針對圖片中任意字體字形和大小的文字進行識別提取,解決了現有圖片文字識別方法對于變體文字識別差錯較大的問題。
本發明實施例之一,一種圖片文字識別方法,該方法包括:
局部分割,將包含有文字信息的圖片分割為多個區域,判斷每個區域是否含有文字信息,對于包含有文字信息的區域提取其中的文字信息;
全局連接,將包含有文字信息的區域進行拼接處理,確定拼接合并區域內文字的中心位置,在根據文字中心位置調整文字區域邊界,確定包含文字信息的區域。
優選的,在局部分割步驟中,將所述的圖片區域再進一步分割,生成多個子區域,判斷每個子區域是否含有文字信息,對于包含有文字信息的子區域提取其中的文字信息。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海兌觀信息科技技術有限公司,未經上海兌觀信息科技技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910106685.0/2.html,轉載請聲明來源鉆瓜專利網。





