[發(fā)明專利]一種金融OCR系統(tǒng)手寫體數(shù)字串的軟切分方法無效

申請?zhí)枺?/td>	201110436948.8	申請日：	2011-12-23
公開（公告）號：	CN102567725A	公開（公告）日：	2012-07-11
發(fā)明（設計）人：	丁杰;彭林;朱力鵬;胡斌	申請（專利權）人：	國網(wǎng)電力科學研究院
主分類號：	G06K9/34	分類號：	G06K9/34
代理公司：	南京知識律師事務所 32207	代理人：	汪旭東
地址：	210003 ***	國省代碼：	江蘇;32
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	一種金融 ocr 系統(tǒng) 手寫體字串切分方法
鉆瓜網(wǎng) 技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

技術領域

本發(fā)明屬于OCR技術領域，涉及一種手寫體字符串的切分方法，該方法可以通過對數(shù)字圖像中筆劃進行模糊特征抽取，并映射到特征片段集，在此基礎上形成候選的切分假設和計算出最優(yōu)的切分結果。

背景技術

目前OCR已成為多種系統(tǒng)的核心技術，得到廣泛的運用并涉及從金融、政府、圖書館到電力、企事業(yè)單位等眾多行業(yè)領域，如文檔影像識別系統(tǒng)(包括文檔錄入、搜索、管理等)、辦公室自動化的文本輸入、郵政編碼自動分揀系統(tǒng)、文檔自動分類系統(tǒng)、車牌自動識別系統(tǒng)、票據(jù)自動處理系統(tǒng)等。一個完整的OCR系統(tǒng)一般需要以下幾個步驟：傾斜圖像的調整、版面分析和版面理解、字符串切分、字符識別以及必要的后處理。在上述OCR技術體系中，字符串切分技術一直是OCR應用軟件研究的熱點和難點。字符切分技術主要解決字符間位置關系的四種形式，即孤立、粘連、交錯以及交疊：孤立是指字符之間各自分開，獨立成為整體；粘連是指兩字符筆劃有一處或多處接觸；交錯是指兩字符在水平方向上的投影有重疊，但字符間沒有實際的粘連；交疊是指兩字符共享某一塊像素區(qū)域，即所謂的共用筆劃。由于筆劃相互粘連是造成手寫數(shù)字串切分困難的重要原因，而對粘連字符識別不準確是產(chǎn)生識別錯誤的主要原因，現(xiàn)階段研究對此展開。

本發(fā)明的研究基礎主要包括以下三個方面：

(1)圖像預處理。字符圖像的預處理是字符分割和識別的前提和基礎，主要針對采集脫機手寫字符過程中存在的干擾信號，如紙張本身帶有的污點或掃描設備性能問題等，特別是由于書寫時用力不均、字體潦草等造成的字符筆劃斷裂和粗細不均，進行圖像的規(guī)整和優(yōu)化，從而避免影響切分和識別的效果。圖像預處理技術通常包括圖像平滑濾波技術、二值化技術等。

(2)主曲線分析。主曲線是通過數(shù)據(jù)分布“中間”并滿足“自相合”的光滑曲線，曲線上的每一點是投影至該點的數(shù)據(jù)點的條件均值。主曲線的理論基礎是尋求嵌入高維空間的非歐氏低維流形，繼承了主成分分析的眾多思想，是線性主成分的非線性推廣，能夠真實地反映數(shù)據(jù)的形態(tài)，即曲線是數(shù)據(jù)集合的“骨架”。主曲線具有對數(shù)據(jù)信息保持性好的優(yōu)點，可以在圖像細化過程中最大限度地保護特征細節(jié)不丟失和細化圖譜的光滑性。

(3)分類器組合和置信度修正。多分類器組合是設計一個高性能，且穩(wěn)定的手寫體數(shù)字識別器的有效途徑，一定程度上克服了導致分類器性能不佳的三類原因：單特征對字符本質反映不全面；噪聲等因素的影響，導致特征對字符描述的不穩(wěn)定；不同類型分類器對特征變化的敏感性和穩(wěn)定性不同導致單分類器性能下降。一般認為，不同性質的特征往往描述字符模式的不同方面，在一種特征空間很難區(qū)分的兩種模式可能在另一種特征空間上很容易分開，而對應于同一特征的不同分類器又從不同的角度(基于概率或最近距離等)將該特征映射到結果集合上，因此往往使用后驗概率對分類器組合的置信度進行修正。

發(fā)明內容

本發(fā)明針對無限制手寫體數(shù)字串的切分問題，提出了一種基于識別的切分方法。將數(shù)字串看成數(shù)字筆劃的集合，依據(jù)主曲線分析抽取數(shù)字筆劃。為克服抽取筆劃的不規(guī)則和集合存在冗余的缺陷，提出了適于數(shù)字筆劃處理的模糊規(guī)則對抽取筆劃進行分裂、合并和篩選，生成適合筆劃組合的筆劃集合。候選切分假設依據(jù)筆劃組合過程生成，文中將筆劃集合中各筆劃在水平方向上進行排序形成筆劃序列，從而通過劃分筆劃序列為子序列集的方式生成候選切分假設，每個子序列對應于一個字符模式。在此基礎上使用組合分類器對各子序列進行識別輸出，生成最優(yōu)的切分假設作為切分結果輸出?？傮w結構見圖1。

附圖說明

圖1總體流程框圖。

圖2是圖像預處理的平滑窗口模板。

圖3是筆劃模糊特征對應的模糊函數(shù)取值。

圖4是筆劃分裂點遍歷的示意圖。

圖5是筆劃組合及識別的示意圖。

圖6是筆劃組合步驟的一個典型示例圖。

具體實施方式

(1)圖像預處理

由于在圖像采集過程中噪聲干擾不可避免，容易造成一些孤立小塊或字符邊緣出現(xiàn)不規(guī)則的鋸齒和噪聲，因此經(jīng)Otsu二值化后的字符圖像還不能直接使用。針對字符筆劃上的毛刺、凹陷以及孤立噪聲點，首先以字符圖像的平均筆劃寬度為依據(jù)對圖像進行濾波處理，但要避免平滑掉過細的筆劃部分，然后逐行掃描二值字符圖像，并依據(jù)給定大小窗口內的圖像結構細節(jié)修改中心像素值，以便剔除筆劃上的毛刺、填平筆劃上的凹陷或內孔，并抑制或消除噪聲對字符切分的影響。

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于國網(wǎng)電力科學研究院，未經(jīng)國網(wǎng)電力科學研究院許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201110436948.8/2.html，轉載請聲明來源鉆瓜專利網(wǎng)。