[發明專利]文字識別方法和裝置有效
| 申請號: | 201610157743.9 | 申請日: | 2016-03-18 |
| 公開(公告)號: | CN107203763B | 公開(公告)日: | 2020-03-06 |
| 發明(設計)人: | 張明明;楊建武;于曉明 | 申請(專利權)人: | 北大方正集團有限公司;北京大學;北京北大方正電子有限公司 |
| 主分類號: | G06K9/32 | 分類號: | G06K9/32;G06K9/34 |
| 代理公司: | 北京同立鈞成知識產權代理有限公司 11205 | 代理人: | 陶敏;劉芳 |
| 地址: | 100871 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文字 識別 方法 裝置 | ||
1.一種文字識別方法,其特征在于,包括:
獲取待識別圖片;
采用三種語種的光學字符識別OCR核心庫對所述待識別圖片進行文字識別,生成各語種的識別結果,所述識別結果中包括了至少一個字符;其中三種語種的OCR核心庫分別為中文語種的OCR核心庫、英文語種的OCR核心庫、藏文語種的OCR核心庫;
確定各語種的識別結果的有效字符比例;
根據各語種的識別結果的有效字符比例,判定所述待識別圖片中的文字的語種、以及所述待識別圖片中的文字的識別有效結果;
所述根據各語種的識別結果的有效字符比例,判定所述待識別圖片中的文字的語種、以及所述待識別圖片中的文字的識別有效結果,包括:
若藏文語種的識別結果的有效字符比例R1小于預設比例,且藏文語種的識別結果的有效字符比例R1大于等于中文語種的識別結果的有效字符比例R2,且藏文語種的識別結果的有效字符比例R1大于等于英文語種的識別結果的有效字符比例R3,則判定所述待識別圖片中的文字的語種為藏文語種、所述待識別圖片中的文字的識別有效結果為藏文語種的識別結果;
若藏文語種的識別結果的有效字符比例R1大于等于預設比例,則判定所述待識別圖片中的文字的語種為藏文語種、所述待識別圖片中的文字的識別有效結果為藏文語種的識別結果;
若藏文語種的識別結果的有效字符比例R1小于預設比例,且藏文語種的識別結果的有效字符比例R1大于等于中文語種的識別結果的有效字符比例R2,且藏文語種的識別結果的有效字符比例R1小于英文語種的識別結果的有效字符比例R3,則判定所述待識別圖片中的文字的語種為英文語種、所述待識別圖片中的文字的識別有效結果為英文語種的識別結果;
若藏文語種的識別結果的有效字符比例R1小于預設比例,且藏文語種的識別結果的有效字符比例R1小于中文語種的識別結果的有效字符比例R2,且中文語種的識別結果的有效字符比例R2大于等于英文語種的識別結果的有效字符比例R3,則判定所述待識別圖片中的文字的語種為中文語種、所述待識別圖片中的文字的識別有效結果為中文語種的識別結果;
若藏文語種的識別結果的有效字符比例R1小于預設比例,且藏文語種的識別結果的有效字符比例R1小于中文語種的識別結果的有效字符比例R2,且中文語種的識別結果的有效字符比例R2小于英文語種的識別結果的有效字符比例R3,則判定所述待識別圖片中的文字的語種為英文語種、所述待識別圖片中的文字的識別有效結果為英文語種的識別結果。
2.根據權利要求1所述的方法,其特征在于,所述確定各語種的識別結果的有效字符比例,包括:
確定各語種的識別結果中的字符個數,并確定各語種的識別結果中的各字符的字符編碼;
確定各語種的識別結果中的各字符的字符編碼,歸屬于各語種的字符編碼區間內的有效字符個數;
根據各語種的識別結果的字符個數,以及各語種的識別結果的有效字符個數,確定各語種的識別結果的有效字符比例。
3.根據權利要求1或2所述的方法,其特征在于,所述根據各語種的識別結果的有效字符比例,判定所述待識別圖片中的文字的語種、以及所述待識別圖片中的文字的識別有效結果,包括:
比較各語種的識別結果的有效字符比例的大小,確定最大值有效字符比例的語種為所述待識別圖片中的文字的語種,并確定最大值有效字符比例的語種的識別結果為所述待識別圖片的文字的識別有效結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北大方正集團有限公司;北京大學;北京北大方正電子有限公司,未經北大方正集團有限公司;北京大學;北京北大方正電子有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610157743.9/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種新型汽車輪罩前圍板加強機構
- 下一篇:一種汽車側圍門檻加強件總成





