[發(fā)明專利]一種金融OCR系統(tǒng)手寫體數(shù)字串的軟切分方法無效
| 申請?zhí)枺?/td> | 201110436948.8 | 申請日: | 2011-12-23 |
| 公開(公告)號: | CN102567725A | 公開(公告)日: | 2012-07-11 |
| 發(fā)明(設計)人: | 丁杰;彭林;朱力鵬;胡斌 | 申請(專利權)人: | 國網(wǎng)電力科學研究院 |
| 主分類號: | G06K9/34 | 分類號: | G06K9/34 |
| 代理公司: | 南京知識律師事務所 32207 | 代理人: | 汪旭東 |
| 地址: | 210003 *** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 金融 ocr 系統(tǒng) 手寫體 字串 切分 方法 | ||
技術領域
本發(fā)明屬于OCR技術領域,涉及一種手寫體字符串的切分方法,該方法可以通過對數(shù)字圖像中筆劃進行模糊特征抽取,并映射到特征片段集,在此基礎上形成候選的切分假設和計算出最優(yōu)的切分結果。
背景技術
目前OCR已成為多種系統(tǒng)的核心技術,得到廣泛的運用并涉及從金融、政府、圖書館到電力、企事業(yè)單位等眾多行業(yè)領域,如文檔影像識別系統(tǒng)(包括文檔錄入、搜索、管理等)、辦公室自動化的文本輸入、郵政編碼自動分揀系統(tǒng)、文檔自動分類系統(tǒng)、車牌自動識別系統(tǒng)、票據(jù)自動處理系統(tǒng)等。一個完整的OCR系統(tǒng)一般需要以下幾個步驟:傾斜圖像的調整、版面分析和版面理解、字符串切分、字符識別以及必要的后處理。在上述OCR技術體系中,字符串切分技術一直是OCR應用軟件研究的熱點和難點。字符切分技術主要解決字符間位置關系的四種形式,即孤立、粘連、交錯以及交疊:孤立是指字符之間各自分開,獨立成為整體;粘連是指兩字符筆劃有一處或多處接觸;交錯是指兩字符在水平方向上的投影有重疊,但字符間沒有實際的粘連;交疊是指兩字符共享某一塊像素區(qū)域,即所謂的共用筆劃。由于筆劃相互粘連是造成手寫數(shù)字串切分困難的重要原因,而對粘連字符識別不準確是產(chǎn)生識別錯誤的主要原因,現(xiàn)階段研究對此展開。
本發(fā)明的研究基礎主要包括以下三個方面:
(1)圖像預處理。字符圖像的預處理是字符分割和識別的前提和基礎,主要針對采集脫機手寫字符過程中存在的干擾信號,如紙張本身帶有的污點或掃描設備性能問題等,特別是由于書寫時用力不均、字體潦草等造成的字符筆劃斷裂和粗細不均,進行圖像的規(guī)整和優(yōu)化,從而避免影響切分和識別的效果。圖像預處理技術通常包括圖像平滑濾波技術、二值化技術等。
(2)主曲線分析。主曲線是通過數(shù)據(jù)分布“中間”并滿足“自相合”的光滑曲線,曲線上的每一點是投影至該點的數(shù)據(jù)點的條件均值。主曲線的理論基礎是尋求嵌入高維空間的非歐氏低維流形,繼承了主成分分析的眾多思想,是線性主成分的非線性推廣,能夠真實地反映數(shù)據(jù)的形態(tài),即曲線是數(shù)據(jù)集合的“骨架”。主曲線具有對數(shù)據(jù)信息保持性好的優(yōu)點,可以在圖像細化過程中最大限度地保護特征細節(jié)不丟失和細化圖譜的光滑性。
(3)分類器組合和置信度修正。多分類器組合是設計一個高性能,且穩(wěn)定的手寫體數(shù)字識別器的有效途徑,一定程度上克服了導致分類器性能不佳的三類原因:單特征對字符本質反映不全面;噪聲等因素的影響,導致特征對字符描述的不穩(wěn)定;不同類型分類器對特征變化的敏感性和穩(wěn)定性不同導致單分類器性能下降。一般認為,不同性質的特征往往描述字符模式的不同方面,在一種特征空間很難區(qū)分的兩種模式可能在另一種特征空間上很容易分開,而對應于同一特征的不同分類器又從不同的角度(基于概率或最近距離等)將該特征映射到結果集合上,因此往往使用后驗概率對分類器組合的置信度進行修正。
發(fā)明內容
本發(fā)明針對無限制手寫體數(shù)字串的切分問題,提出了一種基于識別的切分方法。將數(shù)字串看成數(shù)字筆劃的集合,依據(jù)主曲線分析抽取數(shù)字筆劃。為克服抽取筆劃的不規(guī)則和集合存在冗余的缺陷,提出了適于數(shù)字筆劃處理的模糊規(guī)則對抽取筆劃進行分裂、合并和篩選,生成適合筆劃組合的筆劃集合。候選切分假設依據(jù)筆劃組合過程生成,文中將筆劃集合中各筆劃在水平方向上進行排序形成筆劃序列,從而通過劃分筆劃序列為子序列集的方式生成候選切分假設,每個子序列對應于一個字符模式。在此基礎上使用組合分類器對各子序列進行識別輸出,生成最優(yōu)的切分假設作為切分結果輸出??傮w結構見圖1。
附圖說明
圖1總體流程框圖。
圖2是圖像預處理的平滑窗口模板。
圖3是筆劃模糊特征對應的模糊函數(shù)取值。
圖4是筆劃分裂點遍歷的示意圖。
圖5是筆劃組合及識別的示意圖。
圖6是筆劃組合步驟的一個典型示例圖。
具體實施方式
(1)圖像預處理
由于在圖像采集過程中噪聲干擾不可避免,容易造成一些孤立小塊或字符邊緣出現(xiàn)不規(guī)則的鋸齒和噪聲,因此經(jīng)Otsu二值化后的字符圖像還不能直接使用。針對字符筆劃上的毛刺、凹陷以及孤立噪聲點,首先以字符圖像的平均筆劃寬度為依據(jù)對圖像進行濾波處理,但要避免平滑掉過細的筆劃部分,然后逐行掃描二值字符圖像,并依據(jù)給定大小窗口內的圖像結構細節(jié)修改中心像素值,以便剔除筆劃上的毛刺、填平筆劃上的凹陷或內孔,并抑制或消除噪聲對字符切分的影響。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國網(wǎng)電力科學研究院,未經(jīng)國網(wǎng)電力科學研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110436948.8/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。





