[發明專利]一種圖像文字識別的方法和裝置有效
| 申請號: | 201210279370.4 | 申請日: | 2012-08-07 |
| 公開(公告)號: | CN103577818B | 公開(公告)日: | 2018-09-04 |
| 發明(設計)人: | 韓鈞宇;丁二銳;吳中勤;文林福 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06K9/20 | 分類號: | G06K9/20 |
| 代理公司: | 北京鴻德海業知識產權代理事務所(普通合伙) 11412 | 代理人: | 袁媛 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 圖像 文字 識別 方法 裝置 | ||
本發明提供了一種圖像文字識別的方法和裝置,其中方法包括:S1、獲取待識別圖像中的文字區域;S2、對文字區域中的各字塊分別進行識別并記錄各字塊的位置信息;S3、基于各字塊的位置信息進行版面分析得到語句結構分布;S4、基于語句結構分布對各字塊的識別結果進行基于語義分析的校正,得到校正后的識別結果。本發明有效地利用了文字之間的語義信息對各字塊的識別結果進行修正,提高了圖像文字識別的精度,更好地滿足了用戶的識別需求。
【技術領域】
本發明涉及計算機應用技術領域,特別涉及一種圖像文字識別的方法和裝置。
【背景技術】
隨著移動互聯網的迅速發展,基于移動終端攝像頭采集到的圖像的應用越來越廣泛。其中圖像文字識別技術將圖像中的文字進行識別,轉換為文本文字,從而減輕了用戶輸入對應文字信息的負擔,方便用戶存儲、編輯對應的文字信息。但是圖像文字識別技術是一個十分復雜的技術問題,特別是在圖像內容復雜的情況下,文字識別精度往往無法滿足用戶的需求。
現有的圖像文字識別方法主要包括以下步驟:
1)確定圖像中的字符區域;2)對字符區域進行字符分割,得到各個字塊;3)對各個字塊進行特征提取,將提取的特征與特征數據庫進行匹配,從而得到匹配的各個字符作為識別結果。
雖然上述圖像文字識別方法具有較強的文字識別能力,但由于是基于單個文字的識別,因此容易出現識別誤差且沒有有效的修正措施,文字識別精度較低。
【發明內容】
有鑒于此,本發明提供了一種圖像文字識別的方法和裝置,以便于提高圖像文字識別的精度。
具體技術方案如下:
一種圖像文字識別的方法,該方法包括:
S1、獲取待識別圖像中的文字區域;
S2、對文字區域中的各字塊分別進行識別并記錄各字塊的位置信息;
S3、基于各字塊的位置信息進行版面分析得到語句結構分布;
S4、基于語句結構分布對各字塊的識別結果進行基于語義分析的校正,得到校正后的識別結果。
根據本發明一優選實施例,所述步驟S1具體包括:
服務器接收移動終端發送來的待識別圖像,從所述待識別圖像中提取文字區域;或者,
服務器接收移動終端從待識別圖像中提取并發送來的文字區域。
根據本發明一優選實施例,所述步驟S3具體包括:
利用字塊中心在所述待識別圖像中的坐標信息將在豎直上位置差距小于預設第一閾值的字塊作為一個水平方向的文字行;或者,
利用字塊中心在所述待識別圖像中的坐標信息將在水平上位置差距小于預設第二閾值的字塊作為一個豎直方向的文字行;或者,
利用字塊中心在所述待識別圖像中的坐標信息將在豎直上位置差距小于預設第一閾值且字塊大小差異小于預設大小閾值的字塊作為一個水平方向的文字行;或者,
利用字塊中心在所述待識別圖像中的坐標信息將在水平上位置差距小于預設第二閾值且字塊大小差異小于預設大小閾值的字塊作為一個豎直方向的文字行。
根據本發明一優選實施例,所述步驟S4具體包括:
S41、將文字行中各字塊的識別結果與詞語庫進行匹配,得到構成詞語的識別結果;
S42、利用構成詞語的識別結果以及未構成詞語的識別結果按字塊順序進行組合得到各語句;
S43、確定各語句的語義置信度,以及將各語句與語句數據庫進行匹配,依據匹配狀況確定各語句的匹配置信度;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210279370.4/2.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





