[發明專利]圖片文字識別方法、裝置及平臺在審
| 申請號: | 201910106685.0 | 申請日: | 2019-02-02 |
| 公開(公告)號: | CN109919146A | 公開(公告)日: | 2019-06-21 |
| 發明(設計)人: | 周釗;鄭瑩斌;葉浩 | 申請(專利權)人: | 上海兌觀信息科技技術有限公司 |
| 主分類號: | G06K9/20 | 分類號: | G06K9/20;G06K9/34;G06K9/62;G06N3/04 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 201404 上海市奉*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文字信息 區域提取 子區域 局部分割 拼接處理 圖片文字 拼接 圖片分割 圖片區域 合并 全局 分割 | ||
1.一種圖片文字識別方法,其特征在于,該方法包括:
局部分割,將包含有文字信息的圖片分割為多個區域,判斷每個區域是否含有文字信息,對于包含有文字信息的區域提取其中的文字信息;
全局連接,將包含有文字信息的區域進行拼接處理,根據拼接合并后的區域提取識別出其中的文字信息。
2.根據權利要求1所述的圖片文字識別方法,其特征在于,在全局連接的步驟中,確定拼接合并區域內文字的中心位置,在根據文字中心位置調整文字區域邊界,確定包含文字信息的區域。
3.根據權利要求1所述的圖片文字識別方法,其特征在于,在局部分割步驟中,將所述的圖片區域再進一步分割,生成多個子區域,判斷每個子區域是否含有文字信息,對于包含有文字信息的子區域提取其中的文字信息;
在全局連接步驟中,將包含有文字信息的子區域進行拼接處理,根據拼接合并后的區域提取識別出其中的文字信息。
4.根據權利要求1所述的圖片文字識別方法,其特征在于,所述的分割圖片的區域是矩形形狀。
5.根據權利要求1所述的圖片文字識別方法,其特征在于,圖片中包含的文字是變體文字。
6.根據權利要求1所述的圖片文字識別方法,其特征在于,采用深度神經網絡提取被分割后的圖片區域內的文字信息或者拼接合并后的區域內的文字信息。
7.根據權利要求2所述的圖片文字識別方法,其特征在于,將包含文字信息的區域調整至使得全部文字可以保持水平排列的位置,拼接合并成一個圖片區域后經過文字識別器,獲取文本文字信息。
8.一種圖片文字識別裝置,其特征在于,所述識別裝置包括存儲器;以及
耦合到所述存儲器的處理器,該處理器被配置為執行存儲在所述存儲器中的指令,所述處理器執行以下操作:
局部分割,將包含有文字信息的圖片分割為多個區域,判斷每個區域是否含有文字信息,對于包含有文字信息的區域提取其中的文字信息;
全局連接,將包含有文字信息的區域進行拼接處理,根據拼接合并后的區域提取識別出其中的文字信息。
9.一種圖片文字識別平臺,其特征在于,所述平臺包括服務器,服務器具有存儲器;以及
耦合到所述存儲器的處理器,該處理器被配置為執行存儲在所述存儲器中的指令,所述處理器執行以下操作:
局部分割,將包含有文字信息的圖片分割為多個區域,判斷每個區域是否含有文字信息,對于包含有文字信息的區域提取其中的文字信息;
全局連接,將包含有文字信息的區域進行拼接處理,根據拼接合并后的區域提取識別出其中的文字信息。
10.一種存儲介質,騎上存儲有計算機程序,其特征在于,該程序被處理器執行時,實現如權利要求1至7中任一所述的圖片文字識別方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海兌觀信息科技技術有限公司,未經上海兌觀信息科技技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910106685.0/1.html,轉載請聲明來源鉆瓜專利網。





