[發(fā)明專利]一種字符識別的處理方法和裝置有效
| 申請?zhí)枺?/td> | 201510410166.5 | 申請日: | 2015-07-13 |
| 公開(公告)號: | CN106709489B | 公開(公告)日: | 2020-03-03 |
| 發(fā)明(設(shè)計)人: | 周龍沙;王紅法 | 申請(專利權(quán))人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06K9/32 | 分類號: | G06K9/32 |
| 代理公司: | 深圳市深佳知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 44285 | 代理人: | 王仲凱 |
| 地址: | 518000 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 字符 識別 處理 方法 裝置 | ||
本發(fā)明實施例公開了一種字符識別的處理方法和裝置,用于提高字符識別的識別效果。本發(fā)明實施例方法包括:根據(jù)字符在頁面上的高度信息將所述頁面上的多個字符歸屬到所述頁面上的多個行上,得到所述頁面上的每一行包括的多個字符,所述字符在頁面上的高度信息包括:該字符在所述頁面上的縱坐標和該字符的高度范圍;按照所述頁面上字符之間在高度范圍上的重疊信息對所述頁面上的每個行包括的多個字符進行行校正,得到所述頁面上的每一行包括的行校正后的多個字符;使用語義分析模型對所述頁面上的每一行包括的行校正后的多個字符進行語義校正。
技術(shù)領(lǐng)域
本發(fā)明涉及計算機技術(shù)領(lǐng)域,尤其涉及一種字符識別的處理方法和裝置。
背景技術(shù)
字符分割和字符識別是光學(xué)字符識別(英文全稱:Optical CharacterRecognition,英文縮寫:OCR)技術(shù)中最重要的兩個方面,這兩部分直接影響到字符識別的效果和結(jié)果,在OCR技術(shù)中需要將分割好的字符進行行方向上的排序后呈現(xiàn)給用戶,因此字符的行方向排序技術(shù)會直接影響到呈現(xiàn)給用戶觀看的識別效果。但是當(dāng)前對于OCR的分行技術(shù)主要是基于分割后字符間距來對字符進行簡單的分行。
現(xiàn)有技術(shù)中依據(jù)分割后的字符間距來進行字符的合并和拆分,當(dāng)不同格式的字符進行排版后,拍攝到的每行字符在頁面中有很大傾斜等情況發(fā)生時,對頁面上中的字符識別存在較大的誤差,并且在后續(xù)利用識別結(jié)果進行語義分析時也很難達到很高的準確性。另外,現(xiàn)有技術(shù)中對字符分行是根據(jù)字符間距實現(xiàn)的,但隨著環(huán)境變化在把字符塊組合成行時有很大可能會被其它字符所影響,從而會影響最終所給出的識別效果。
發(fā)明內(nèi)容
本發(fā)明實施例提供了一種字符識別的處理方法和裝置,用于提高字符識別的識別效果。
為解決上述技術(shù)問題,本發(fā)明實施例提供以下技術(shù)方案:
第一方面,本發(fā)明實施例提供一種字符識別的處理方法,包括:
根據(jù)字符在頁面上的高度信息將所述頁面上的多個字符歸屬到所述頁面上的多個行上,得到所述頁面上的每一行包括的多個字符,所述字符在頁面上的高度信息包括:該字符在所述頁面上的縱坐標和該字符的高度范圍;
按照所述頁面上字符之間在高度范圍上的重疊信息對所述頁面上的每個行包括的多個字符進行行校正,得到所述頁面上的每一行包括的行校正后的多個字符;
使用語義分析模型對所述頁面上的每一行包括的行校正后的多個字符進行語義校正。
第二方面,本發(fā)明實施例還提供一種字符識別的處理裝置,包括:
行拆分模塊,用于根據(jù)字符在頁面上的高度信息將所述頁面上的多個字符歸屬到所述頁面上的多個行上,得到所述頁面上的每一行包括的多個字符,所述字符在頁面上的高度信息包括:該字符在所述頁面上的縱坐標和該字符的高度范圍;
行校正模塊,用于按照所述頁面上字符之間在高度范圍上的重疊信息對所述頁面上的每個行包括的多個字符進行行校正,得到所述頁面上的每一行包括的行校正后的多個字符;
語義校正模塊,用于使用語義分析模型對所述頁面上的每一行包括的行校正后的多個字符進行語義校正。
從以上技術(shù)方案可以看出,本發(fā)明實施例具有以下優(yōu)點:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于騰訊科技(深圳)有限公司,未經(jīng)騰訊科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510410166.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:根據(jù)指定位置進行圖像識別的方法
- 下一篇:一種字符識別方法和裝置
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標記或含有代碼標記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合





