[發明專利]字符串提取方法以及字符串提取裝置有效
| 申請號: | 201180069000.1 | 申請日: | 2011-03-04 |
| 公開(公告)號: | CN103460222B | 公開(公告)日: | 2017-07-07 |
| 發明(設計)人: | 后藤雅典;米澤亨;黑巖素子 | 申請(專利權)人: | 光榮株式會社 |
| 主分類號: | G06K9/20 | 分類號: | G06K9/20 |
| 代理公司: | 北京市柳沈律師事務所11105 | 代理人: | 胡金瓏 |
| 地址: | 日本*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 字符串 方法 以及 裝置 | ||
技術領域
本發明涉及從拍攝了紙張類的紙張類圖像中切出字符串而進行字符識別時的字符串切出方法以及字符串切出裝置。
背景技術
在紙幣、支票、票據或商品券等的紙張類中,作為識別號而印刷有用于確定該紙張類的字符串。在紙幣的情況下,該識別號被稱為序列號。例如,在發現了偽造紙幣的情況下,能夠利用該序列號來確認該偽造紙幣是否為自行交易的紙幣。因此,在金融機構等中,存在想要對該序列號自動地進行字符識別并注冊在數據庫中,對交易的紙幣進行管理的要求。
為了利用紙幣的序列號而構筑數據庫,需要對作為數據而注冊的序列號準確地進行字符識別,但該字符識別是從拍攝了紙幣的紙幣圖像中切出序列號圖像而進行。因此,需要確定作為序列號的字符串的位置而準確地切出圖像。作為用于切出圖像上的字符串的技術,例如在專利文獻1中,公開了基于顏色信息而區分背景和字符串,僅切出字符串的圖像的方法。具體而言是如下方法:利用彩色的紙幣圖像,通過從包含字符串的區域的圖像中去掉表示背景的顏色的像素而僅切出字符串的圖像。
此外,在專利文獻2中,公開了利用在字符和背景中濃度不同的情況而切出字符串的圖像的方法。具體而言是如下方法:通過包含字符串的區域,生成投射了圖像的濃度的直方圖,并將濃度投射值超過預定閾值的區域作為字符串圖像而切出。通過調整閾值,使得切出的區域的寬度與預先設定的字符串圖像的寬度在容許范圍內一致,能夠從背景或污漬中分離序列號圖像而切出。
此外,在專利文獻3中,公開了通過字符切出窗口在字符串上進行掃描而檢測各字符的位置,從而一個字符一個字符地切出形成字符串的各字符的方法。具體而言是如下方法:利用字符切出窗口,該字符切出窗口由與在形成字符串的字符中大小最小的字符匹配而設置的中心區域、在中心區域的外側與最大的字符匹配而設置的帶狀的外接區域、在外接區域的外側基于各字符間的間隔而設置的帶狀的背景區域構成。通過在被2值化的字符串圖像上移動字符切出窗口,當在背景區域以及外接區域中形成區域內的字符的像素的合計面積滿足預定條件且在中心區域中字符的投射長度滿足預定值的情況下,將該位置檢測作為字符位置而切出字符圖像。
現有技術文獻
專利文獻
專利文獻1:特開2010-225013號公報
專利文獻2:特開平6-301814號公報
專利文獻3:特公平7-99532號公報
發明內容
發明要解決的課題
但是,在利用顏色信息的專利文獻1的方法中,存在在印刷的字符串和背景為同色系的情況下不能區分背景和字符串的情況。紙幣根據發行國或現金種類而具有各種大小、顏色、花紋等,但也有序列號以與背景相同的色系而被印刷的情況,不能應對這樣的情況。
此外,在利用表示了字符串的濃度的直方圖的專利文獻2的方法中,存在若在字符串附近印刷了字符識別對象外的字符或者在字符串的背景中有圖案或花紋,則不能準確地切出字符串的情況。存在在紙幣上除了序列號以外還印刷了與發行國有關的信息或金額等的信息的情況。此外,也存在在序列號的背景中描畫了圖案或花紋的情況。若存在序列號以外的字符或背景的花紋,則因直方圖的值變化,所以對序列號的切出處理產生影響。
具體而言,例如圖20(A)所示,若在表示序列號區域101的Y方向的濃度分布的直方圖中切出超過圖示的閾值h的區域,則成為僅切出在序列號102的上部印刷的切出對象外的字符串103的圖像。此外,即使將閾值降低為包含序列號102,通過切出包含對象外字符串103和序列號102兩者的圖像區域,也不能切出僅包含序列號102的圖像。其結果,存在即使在切出的區域中進行字符識別也不能對序列號102準確地進行字符識別的情況。另外,也有縮小作為序列號區域101的區域的Y方向的高度,使得對象外的字符串103不包含在區域101內的方法,但存在因在序列號102的印刷位置上存在誤差,所以不能縮小的情況。此外,如圖20(B)所示,在序列號102的背景中描畫了花紋的情況下,受到背景的影響。即使在表示序列號區域101的X方向的濃度分布的直方圖中切出超過圖示的閾值h的區域,也不能準確地確定形成序列號102的各字符的位置。
此外,在利用相當于一個字符量的大小的字符切出窗口的專利文獻3的方法中,如圖20(B)所示的情況下,也因字符和背景的濃度差小所以不能準確地檢測各字符的位置,不能切出各字符。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于光榮株式會社,未經光榮株式會社許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201180069000.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:用于廣播網絡的多路光纖自動備份裝置
- 下一篇:一種鑒頻鑒相器





