[發(fā)明專利]字符識(shí)別方法在審
| 申請(qǐng)?zhí)枺?/td> | 201810998921.X | 申請(qǐng)日: | 2018-08-29 |
| 公開(kāi)(公告)號(hào): | CN109190630A | 公開(kāi)(公告)日: | 2019-01-11 |
| 發(fā)明(設(shè)計(jì))人: | 熊興發(fā);孔令晏 | 申請(qǐng)(專利權(quán))人: | 摩佰爾(天津)大數(shù)據(jù)科技有限公司 |
| 主分類號(hào): | G06K9/34 | 分類號(hào): | G06K9/34;G06K9/38 |
| 代理公司: | 北京細(xì)軟智谷知識(shí)產(chǎn)權(quán)代理有限責(zé)任公司 11471 | 代理人: | 趙芳 |
| 地址: | 300450 天津市濱海新區(qū)天津自貿(mào)試驗(yàn)區(qū)(*** | 國(guó)省代碼: | 天津;12 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 字符識(shí)別 單字符圖像 二值化圖像 圖像 輸入字符識(shí)別 二值化處理 全面覆蓋 圖片文字 英文字符 申請(qǐng) 漢字 漢語(yǔ) 分割 中文 | ||
本申請(qǐng)涉及一種字符識(shí)別方法,包括:獲取待識(shí)別圖像;對(duì)所述待識(shí)別圖像進(jìn)行二值化處理得到二值化圖像,并將二值化圖像分割為若干單字符圖像;將所述單字符圖像輸入字符識(shí)別模型進(jìn)行識(shí)別。本申請(qǐng)針對(duì)漢語(yǔ)環(huán)境下,圖片文字識(shí)別結(jié)果中混合含有了中文、數(shù)字以及英文字符的情況,設(shè)計(jì)了一套字符識(shí)別方案,對(duì)于字符的支持完善,能夠?qū)崿F(xiàn)對(duì)常見(jiàn)漢字的全面覆蓋,并且識(shí)別效果好。
技術(shù)領(lǐng)域
本申請(qǐng)涉及光學(xué)字符識(shí)別技術(shù)領(lǐng)域,具體涉及一種字符識(shí)別方法。
背景技術(shù)
光學(xué)字符識(shí)別(OCR,Optical Character Recognition)是用于將含有字符的 圖片中的字符識(shí)別為文字格式的技術(shù)。在英文的OCR識(shí)別場(chǎng)景中,只需要識(shí) 別26個(gè)字母加10個(gè)數(shù)字就可以解讀出英文圖片中的信息內(nèi)容。而中文漢字 擁有復(fù)雜的結(jié)構(gòu)構(gòu)成的同時(shí)還具有龐大的識(shí)別數(shù)量問(wèn)題,因此絕大部分漢字 識(shí)別的OCR技術(shù)的效果都不是很好。
在數(shù)量上,漢字僅常用一級(jí)漢字就有3500多個(gè),再加上二級(jí)漢字的話總 數(shù)會(huì)達(dá)到6500多個(gè),這還不包括繁體字以及古體字等不常見(jiàn)字;顯然,漢字 遠(yuǎn)比英文26個(gè)小寫字母加26個(gè)大寫字母組成的單詞多很多。而在字體形態(tài) 方面,同一個(gè)漢字的寫法還存在不同的字體形式:比如宋體、楷體、黑體等, 而這也增加了中文OCR技術(shù)的進(jìn)步難度。另外,在單字符分割領(lǐng)域大部分程 序常用的是對(duì)二值化后的圖像進(jìn)行腐蝕+膨脹配合去噪的方式,這種方式對(duì)于 椒鹽噪聲常常能夠起到一定效果,但是也帶來(lái)了對(duì)于復(fù)雜環(huán)境下拍攝圖像無(wú) 法很好得到文字細(xì)節(jié)而導(dǎo)致文字黏連的情形,因此這種二值化后的去噪效果 可以說(shuō)是很不穩(wěn)定的。
相關(guān)技術(shù)中,目前的字符識(shí)別模型或者方法要么效果太差,要么對(duì)于字 符的支持不夠完善,無(wú)法完成對(duì)于6763個(gè)一二級(jí)簡(jiǎn)體漢字、10個(gè)數(shù)字以及 52個(gè)大小寫英文字母數(shù)據(jù)和常見(jiàn)符號(hào)的全覆蓋,因此很有必要提出一種能夠 廣泛應(yīng)用于漢字的字符識(shí)別方案。
此外,身份證是證明自身身份的官方證件,在一些場(chǎng)合中需要錄入身份 證信息。如果驗(yàn)證方僅有當(dāng)事人身份證圖像信息,那么只能借助OCR技術(shù)去 識(shí)別身份證上的信息,以完成信息錄入工作。
而當(dāng)前存在的身份證識(shí)別類項(xiàng)目中,很少考慮實(shí)際應(yīng)用中獲取的照片中 存在噪聲的情況:如光照不均勻、圖像不對(duì)齊、圖像尺寸不一致等,因此有 必要提出一些技術(shù)創(chuàng)新來(lái)排除這些干擾信息對(duì)于識(shí)別結(jié)果的影響。
發(fā)明內(nèi)容
為至少在一定程度上克服相關(guān)技術(shù)中存在的問(wèn)題,本申請(qǐng)?zhí)峁┮环N字符 識(shí)別方法。
根據(jù)本申請(qǐng)的實(shí)施例,提供一種字符識(shí)別方法,包括:
獲取待識(shí)別圖像;
對(duì)所述待識(shí)別圖像進(jìn)行二值化處理得到二值化圖像,并將二值化圖像分 割為若干單字符圖像;
將所述單字符圖像輸入字符識(shí)別模型進(jìn)行識(shí)別。
進(jìn)一步地,所述對(duì)所述待識(shí)別圖像進(jìn)行二值化處理,包括:
采用至少兩種閾值化算法分別對(duì)所述待識(shí)別圖像進(jìn)行二值化處理;
將至少兩種不同算法處理后得到的圖像進(jìn)行邏輯與操作。
進(jìn)一步地,所述至少兩種閾值化算法包括:OTSU閾值化算法和局部自適 應(yīng)閾值化算法。
進(jìn)一步地,所述將二值化圖像分割為若干單字符圖像,包括:
根據(jù)所述二值化圖像的像素分布情況,將所述二值化圖像分割為包含文 字信息的多個(gè)行圖像或列圖像;
再根據(jù)每個(gè)行圖像或列圖像的像素分布,將行圖像或列圖像分割為若干 單字符圖像。
進(jìn)一步地,所述將二值化圖像分割為若干單字符圖像,包括:
對(duì)所述二值化圖像進(jìn)行橫向投影,得到豎直方向的像素分布情況;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于摩佰爾(天津)大數(shù)據(jù)科技有限公司,未經(jīng)摩佰爾(天津)大數(shù)據(jù)科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810998921.X/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 用于使用多重掃描技術(shù)進(jìn)行欺詐檢測(cè)的裝置、系統(tǒng)和方法
- 字符識(shí)別方法、裝置、計(jì)算機(jī)設(shè)備和計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種基于深度學(xué)習(xí)的車牌字符識(shí)別方法
- 一種字符識(shí)別圖像的生成方法、電子設(shè)備和可讀存儲(chǔ)介質(zhì)
- 字符識(shí)別模板匹配方法、裝置和文本識(shí)別設(shè)備
- 信息處理裝置、記錄媒體及信息處理方法
- 圖像字符識(shí)別方法、裝置、介質(zhì)及電子設(shè)備
- 圖像字符識(shí)別方法、裝置、介質(zhì)及電子設(shè)備
- 字符識(shí)別方法、裝置、可讀介質(zhì)及電子設(shè)備
- 字符識(shí)別結(jié)果顯示方法及字符識(shí)別系統(tǒng)
- 身份證圖像的傾斜值獲取方法及裝置、終端、存儲(chǔ)介質(zhì)
- 一種基于深度學(xué)習(xí)模型的OCR識(shí)別方法及終端
- 文本識(shí)別方法、裝置及設(shè)備
- 基于數(shù)據(jù)增廣和卷積神經(jīng)網(wǎng)絡(luò)的銀行卡卡號(hào)自動(dòng)識(shí)別方法
- 字符批量識(shí)別方法、裝置和計(jì)算機(jī)設(shè)備
- 字符識(shí)別方法及其裝置、字符識(shí)別模型的訓(xùn)練方法及其裝置
- 一種簽名識(shí)別方法及設(shè)備
- 字符分割方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 數(shù)據(jù)集制作方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 字符合并方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





