[發(fā)明專利]字符識別裝置及方法、字符識別程序有效
| 申請?zhí)枺?/td> | 201310661200.7 | 申請日: | 2013-12-06 |
| 公開(公告)號: | CN103870823A | 公開(公告)日: | 2014-06-18 |
| 發(fā)明(設(shè)計)人: | 三好利升;新莊廣;永崎健;堤庸昂 | 申請(專利權(quán))人: | 株式會社日立信息通信工程 |
| 主分類號: | G06K9/20 | 分類號: | G06K9/20;G06K9/00 |
| 代理公司: | 北京市金杜律師事務(wù)所 11256 | 代理人: | 陳偉;王娟娟 |
| 地址: | 日本神*** | 國省代碼: | 日本;JP |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 字符 識別 裝置 方法 程序 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及字符識別裝置及方法、字符識別程序,尤其涉及具有組合了多個舍棄值的舍棄判定方式的光學(xué)式字符識別裝置及方法、字符識別程序。另外,本實施例在字符識別的技術(shù)中尤其還涉及舍棄的技術(shù)。
背景技術(shù)
本技術(shù)領(lǐng)域涉及光學(xué)式字符識別(OCR:Optical?Character?Recognition;光學(xué)字符識別)裝置。OCR裝置通過掃描儀等讀取紙類文件,并識別圖像中的文字和/或符號,由此,通過代碼化成Unicode(統(tǒng)一碼)等來進行電子化。OCR裝置在一般企業(yè)、自治機構(gòu)、金融機構(gòu)、醫(yī)療機構(gòu)、教育機構(gòu)等中,用于會計票據(jù)、繳納完成通知書、工資報告單、訂單、成批轉(zhuǎn)賬單、醫(yī)療費用明細(xì)、答題紙等的電子化。另外,面向一般用戶時,在基于移動電話進行的字符識別、便簽等一般文件中的字符識別中使用。
簡略地說明基于OCR裝置的文件電子化的處理流程。
圖6是用于說明基于字符識別裝置的文件電子化的流程圖。首先,進行基于掃描儀等的文件圖像化、二值化和噪聲處理等的前處理。由此,例如能夠得到圖6的附圖標(biāo)記601那樣的二值的文件圖像。接下來,通過基于OCR裝置進行的、圖表位置和/或文件段落構(gòu)造等的布局分析和字符串提取,而得到例如圖6的附圖標(biāo)記602那樣的字符串圖像。之后,OCR裝置通過字符切取而從字符串圖像中切取字符單位的圖像,然后,識別各個圖像中的字符。從文件的圖像化到字符串提取為止的處理例如在專利文件1、專利文獻2中有所記載。另外,到從字符串圖像中識別各個字符為止的處理例如在專利文獻3、非專利文獻1、非專利文獻2中有所記載。
本技術(shù)涉及各個字符圖像的識別技術(shù)。以下,簡單說明對各個字符圖像中描繪的字符進行識別的技術(shù)。
首先,進行將字符圖像轉(zhuǎn)換為矢量值的特征提取處理。當(dāng)將矢量值的維數(shù)設(shè)為N時,通過特征提取處理而將一個字符圖像表現(xiàn)為N維矢量。從相同字符種類的字符圖像中提取的N維矢量分布在N維空間中的較近位置上。
圖9通過示意圖而示出上述情況。圓形、三角形、四邊形分別表示從與字符種類A、字符種類B、字符種類C對應(yīng)的各字符圖像提取出的矢量值。
接下來,參照預(yù)先生成的字符識別用辭典,基于從字符圖像提取出的矢量值,來識別字符圖像中描繪的字符。
在此,首先說明字符識別辭典。在字符識別用辭典中,例如對于各識別對象字符種類k而保存有將N維矢量取為自變量、將實數(shù)值取為值的識別函數(shù)fk(x)。識別函數(shù)fk(x)是以針對從描繪有字符種類k的字符圖像所生成的N維矢量x而取較大值,針對從描繪有其他字符種類的字符圖像所生成的N維矢量x而取較小值的方式,預(yù)先通過學(xué)習(xí)而生成的。識別函數(shù)fk(x)的值稱為相對于矢量x的字符種類k的相似度、似然度(likelihood)等。例如,在將數(shù)字作為對象來識別的情況下,與0~9這十個數(shù)字種類對應(yīng)地存在有10個識別函數(shù)f0(x)、f1(x)、…、f9(x)。
在字符的識別中,使用從字符圖像提取出的N維矢量x,來計算各字符種類的識別函數(shù)fk(x)的值。識別函數(shù)fk(x)的值是相對于字符種類k的相似度,由此,fk(x)的值最大的字符種類k成為識別結(jié)果的第一候選。同樣地,值第二大的識別函數(shù)對應(yīng)的字符種類k成為識別結(jié)果的第二候選。這樣,能夠得到直到第n候補的識別結(jié)果。
圖7是用于說明字符識別結(jié)果的圖。例如,通過圖6的字符切取(附圖標(biāo)記603)所切取的字符圖像的識別如圖7所示。通過以上內(nèi)容,得到圖6的附圖標(biāo)記604那樣的識別結(jié)果,并轉(zhuǎn)換為計算機能處理的字符代碼等的代碼。
上述所說明的字符識別是計算字符圖像和各識別對象字符種類的相似度,并基于此而得到候選字符的處理。為了提高OCR裝置的有用性,該字符識別的精度是重要的。但是,在識別結(jié)果可疑的情況下,使通知該情況的識別結(jié)果的舍棄處理也是重要的。
圖12是用于表示非字符和不明確字符的示例的圖。在成為舍棄對象的字符中,具有例如圖12的字符例1201所示的非字符、和字符串1202所示的不明確字符。非字符例如是基于字符切取錯誤所導(dǎo)致的字符的一部分和/或多個字符合在一起的圖像、混入了污漬等干擾因素的圖像等。不明確字符例如是如字符例1202的左端圖像所示地?zé)o法區(qū)別7和9的情況等。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于株式會社日立信息通信工程,未經(jīng)株式會社日立信息通信工程許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310661200.7/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合





