[發明專利]拒識方法和拒識裝置有效
| 申請號: | 201010195920.5 | 申請日: | 2010-06-08 |
| 公開(公告)號: | CN102279927A | 公開(公告)日: | 2011-12-14 |
| 發明(設計)人: | 朱遠平;孫俊;堀田悅伸;直井聰;于浩 | 申請(專利權)人: | 富士通株式會社 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 康建峰;陳煒 |
| 地址: | 日本神*** | 國省代碼: | 日本;JP |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 方法 裝置 | ||
技術領域
本發明一般地涉及字符識別。具體而言,本發明涉及一種基于拒識閾值映射對拒識判決進行優化的拒識方法和拒識裝置。
背景技術
在OCR(optical?character?recognition,光學字符識別)研究中,離線手寫字符識別由于其大的類別數目和大量書寫風格的變化或者變形而仍然是一個挑戰。例如,對于漢字字符識別來說,最常用的字符包括在具有3755個字符的一級國標字符集中。而剩下還有超過幾千個漢字不常使用。手寫漢字識別的較高準確度,比如接近99%等在實際應用中難以獲得。因此,在很多實際應用中,如果可以拒識字符識別裝置的不可靠的識別結果而通過人工或者其他方式處理那些識別結果,則剩余部分將具有較高的準確度??偟膩碚f這是一個拒識問題,由此如何作出好的拒識判斷是至關重要的。
對于拒識,其目的是獲得最低的錯誤比率同時拒識最少的識別結果。改善字符識別裝置的識別能力可以獲得更好的拒識,但是這不是這里要討論的問題。在此,關注于拒識參數的優化,從而能夠在不改變當前的識別技術和結果的同時而改善拒識性能。
在過去幾年中已經提出了許多拒識策略。例如,J.Pitrelli和M.P.Perrone在“Confidence?modeling?for?verification?post-processing?forhandwriting?recognition,Proceedings?of?the?8th?International?Workshopon?Frontiers?in?Handwriting?Recognition(IWFHR2002),pp.30-35,2002”中以及R.Bertolami、M.Zimmermann和H.Bunke在“Rejectionstrategies?for?offline?handwritten?text?line?recognition,PatternRecognition?Letters,27(16):pp.2005-2012,2006”中提出了幾種有效的置信量度方法,從而可以通過置信變換來改善拒識性能。另外,在Xu-ChengYin、Hong-Wei?Hao、Yun-Feng?Tang、Jun?Sun和Satoshi?Naoi的“Rejection?Strategies?with?Multiple?Classifiers?for?HandwrittenCharacter?Recognition,Proceedings?of?the?10th?International?Conferenceon?Document?Analysis?and?Recognition(ICDAR2009),pp.1126-1130,2009”中以及在L.?P.Cordella、P.Foggia、C.Sansone、F.?Tortorella和M.Vento的“Optimizing?the?Error/Reject?Trade-Off?for?a?Multi-ExpertSystem?Using?the?Bayesian?Combining?Rule,Proceedings?of?the?JointIAPR?International?Workshops?on?Advances?in?Pattern?Recognition,LNCS?Vol.1451,pp.716-725,1998”中,還將來自多個分類器系統的交叉驗證能力用于對拒識性能進行改善。
此外,N.Gorski在“Optimizing?error-reject?trade?off?in?recognitionsystems,Proceedings?of?the?4th?International?Conference?on?DocumentAnalysis?and?Recognition(ICDAR1997),pp.1092-1096,1997”中通過訓練神經網絡分類器來作出拒識判決。
除了上述N.Gorski的方法是基于分類的系統之外,大多數方法使用閾值來判決是否拒識識別結果。這些方法均使用閾值作為通用方式,并且針對所有的樣本應用相同的拒識閾值。但是,對于具體樣本來說這并不是最優的方式。實際上,單個樣本的局部信息可能會對拒識參數的選擇產生相當大的影響。
發明內容
有鑒于此,本發明提出了一種新的拒識方法和拒識裝置用于光學字符識別,能夠基于拒識閾值映射對拒識判決進行優化,從而能夠在不改變當前的識別技術和結果的同時達到改善拒識性能的目的。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于富士通株式會社,未經富士通株式會社許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010195920.5/2.html,轉載請聲明來源鉆瓜專利網。





