[發(fā)明專利]字符識別方法、使用該方法的字符識別裝置有效
| 申請?zhí)枺?/td> | 201280069116.X | 申請日: | 2012-11-28 |
| 公開(公告)號: | CN104094288B | 公開(公告)日: | 2017-07-28 |
| 發(fā)明(設(shè)計)人: | 藤枝紫朗 | 申請(專利權(quán))人: | 歐姆龍株式會社 |
| 主分類號: | G06K9/68 | 分類號: | G06K9/68;G06K9/20;G06K9/34;G06K9/62 |
| 代理公司: | 北京三友知識產(chǎn)權(quán)代理有限公司11127 | 代理人: | 李輝,黃綸偉 |
| 地址: | 日本國京*** | 國省代碼: | 暫無信息 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 字符 識別 方法 使用 裝置 程序 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及基于圖像處理的字符識別處理,尤其涉及用于識別由沿寬度方向排列的一對字符要素構(gòu)成的復(fù)合字符的技術(shù)。
背景技術(shù)
在字符識別處理中,通常從拍攝字符串而生成的濃淡圖像中切取各個字符,對切取出的每個字符實施使用了各種字符模型的匹配處理(模型匹配),從而識別字符串的內(nèi)容。在字符的切取處理中,將處理對象的圖像的2值化數(shù)據(jù)或者濃淡數(shù)據(jù)向x軸方向、y軸方向分別進(jìn)行投影,從在各軸生成的投影圖案中提取對應(yīng)字符的部位,由此確定對應(yīng)各個字符的區(qū)域(以下稱為“字符區(qū)域”)。
為了確保匹配處理的精度,需要對識別對象的每個字符確定字符區(qū)域,但是在各個獨立的字符要素沿著與字符串對應(yīng)的寬度方向排列而構(gòu)成的復(fù)合字符中,各字符要素被獨立地切取,有時進(jìn)行錯誤的匹配處理。
關(guān)于上述問題,在專利文獻(xiàn)1中記載了這樣的內(nèi)容,在提取了針對預(yù)先學(xué)習(xí)過的漢字的偏旁的部分的可靠度較大的候選字符的情況下,判定為進(jìn)行了錯誤的切取,將適合于偏旁的候選字符及其下一個候選字符一起作為一個字符重新切取(參照第0033段等)。
另外,在專利文獻(xiàn)2中記載了這樣的內(nèi)容,在切取字符后進(jìn)行暫時匹配處理并計算匹配可靠度,根據(jù)滿足匹配可靠度為規(guī)定的基準(zhǔn)值以上等條件的候選字符決定全角字符的標(biāo)準(zhǔn)字符長度,然后根據(jù)識別出的標(biāo)準(zhǔn)字符長度切取識別對象的所有字符,并進(jìn)行正式匹配處理(參照權(quán)利要求1等)。另外,當(dāng)假設(shè)在匹配處理中提取了能夠?qū)蓚€字符部分結(jié)合的字符(例如,將漢字的“日”和“月”組合得到的“明”)的情況下,不將該字符用于標(biāo)準(zhǔn)字符長度的決定處理中(參照第0015~0022段、第0061~0068段、第0089段等)。
現(xiàn)有技術(shù)文獻(xiàn)
專利文獻(xiàn)
專利文獻(xiàn)1:日本公開專利公報1997-282417號公報
專利文獻(xiàn)2:日本公開專利公報2010-44485號公報
發(fā)明內(nèi)容
發(fā)明要解決的問題
在專利文獻(xiàn)2中披露了不清楚一對字符要素(漢字的“日”和“月”等)的組合表示一個字符、還是表示兩個字符的情況。在將這種能夠獨立地識別為字符的字符要素組合而得到的復(fù)合字符中,各字符要素被獨立地識別時的一致度提高,因而識別的錯誤被漏看的可能性比較大。
另外,在專利文獻(xiàn)1中僅是公開了這樣的思想,根據(jù)一方的字符要素的特征識別出對字符的切取有錯誤,而重新進(jìn)行切取處理。
根據(jù)專利文獻(xiàn)2記載的發(fā)明,如果兩個字符要素的組合的寬度接近標(biāo)準(zhǔn)字符寬度,則該組合作為一個字符被切取,然而如果對如基于西語字符的字符串那樣字符尺寸的偏差較大的字符串采用這種識別方法,將有可能產(chǎn)生錯誤識別。并且,在復(fù)合字符獨立成為識別對象的情況下,不能采用專利文獻(xiàn)2記載的識別方法。
本發(fā)明正是著眼于上述問題而提出的,其課題是高精度地識別復(fù)合字符,而且不受在獨立核對各個字符要素時得到的一致度和各個字符要素的尺寸的變動的影響。
用于解決問題的手段
本發(fā)明的字符識別方法從拍攝字符串而生成的濃淡圖像中切取字符串內(nèi)的各個字符,依次關(guān)注所切取的字符圖像,通過與多種字符的模型圖像進(jìn)行核對,求出關(guān)注中的字符圖像與各模型圖像的一致度,根據(jù)這些一致度識別對應(yīng)字符圖像的字符。
為了解決上述問題,在本發(fā)明中,將由沿著寬度方向排列的一對字符要素構(gòu)成的復(fù)合字符的模型圖像,按照被賦予了規(guī)定的識別信息的狀態(tài)進(jìn)行登記。
并且,在使用了附帶識別信息的模型圖像的核對處理中,執(zhí)行將包括關(guān)注中的字符圖像及其相鄰的未處理的字符圖像的范圍中的圖像、與該模型圖像進(jìn)行核對的復(fù)合核對。并且,在通過復(fù)合核對而得到的一致度超過預(yù)先設(shè)定的基準(zhǔn)值時,將包含在該復(fù)合核對的對象范圍中的兩個字符圖像的組合,識別為與被核對的附帶識別信息的模型圖像對應(yīng)的字符。
例如,在橫寫的字符串成為識別對象的情況下,對于一對字符要素左右排列而構(gòu)成的字符,登記復(fù)合字符的模型圖像。并且,在識別處理中,在切取字符后,沿著字符串依次關(guān)注所切取的字符,并實施與各種字符的模型圖像的核對處理。在這種情況下的復(fù)合核對中,包括關(guān)注中的字符圖像及其相鄰的未處理的字符圖像的范圍中的圖像被設(shè)定為核對對象。
如果復(fù)合核對的對象范圍內(nèi)的字符圖像的組合不屬于復(fù)合字符,則一致度應(yīng)該降低,但是在兩個字符圖像的組合相當(dāng)于復(fù)合字符的情況下,可以理解為得到較高的一致度。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于歐姆龍株式會社,未經(jīng)歐姆龍株式會社許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201280069116.X/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合





