[發明專利]一種文字識別方法無效
| 申請號: | 201210396484.7 | 申請日: | 2012-10-17 |
| 公開(公告)號: | CN102945369A | 公開(公告)日: | 2013-02-27 |
| 發明(設計)人: | 金連文;陶大鵬;黎小鳳 | 申請(專利權)人: | 華南理工大學 |
| 主分類號: | G06K9/20 | 分類號: | G06K9/20 |
| 代理公司: | 廣州粵高專利商標代理有限公司 44102 | 代理人: | 邱奕才 |
| 地址: | 510640 廣*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 文字 識別 方法 | ||
技術領域
本發明屬于模式識別與人工智能技術領域中的文字識別方向,特別是涉及一種文字識別方法。
背景技術
文字識別是當今備受關注的一個課題,它是模式識別的一個重要分支,也是人工智能和模式識別研究中的一個重要方向。漢字的種類繁多、筆畫復雜、相似字多,而且不同人的手寫漢字風格迥異,因此手寫漢字識別,尤其是手寫漢字的相似字識別,一直是文字識別中的一個難點和關注點。
在實際應用中,一般的手寫漢字識別系統里為了提高識別率通常都要對手寫漢字提取高維的特征向量,以獲得更多有助于識別的字體特征信息。但是由于特征向量的維數很高,而且識別中的涉及的字體數目較多,為了運算降低存儲量、加快識別的運算速度以及提高識別的正確率,一般都對高維空間的特征向量進行降維映射。目前用于漢字識別比較流行的數據降維算法是線性判別分析法(Linear?Discriminate?Analysis,LDA)。但是,考慮到漢字類別數眾多(如GB1有3755個漢字),采用LDA降維后直接分類,并不能達到很好的識別效果。因此,流行的做法用層級分類的方案。傳統的兩級LDA選擇方案的實現首先是直接用LDA降維,然后進行粗分類得出首選字及其候選字,接著對首選字和其他候選字組成的相似字集合進行第二級LDA映射,最后用小類別的強分類器得出最終的識別結果。這里需要說明的是其他候選字的生成可以采用一種快速的靜態候選字生成技術,這里不作敘述。
雖然這種使用了兩級的LDA層級分類的漢字識別方案,相對于直接的一級分類識別的方法來說,識別率有了很大的提高,但是,如何進一步從樣本中獲取判別信息,以提高識別率是漢字識別努力的一個方向。傳統的LDA并沒有很好的保存數據的判別信息。因此,如果能找到適合的降維算法更好地保留手寫漢字的判別信息,其識別率仍有改進的空間。
數據降維的其中一個最主要的問題就是找到一個合適的投影,使原始數據從高維空間變換到低維子空間。它的目的是將數據從高維數據轉換到一個可以揭示數據分布固有空間結構的低維空間,使數據得到一個更加簡潔、有效的表達。傳統的全局線性降維的方法主要是基于線性的,其中主成分分析法(PCA)、線性判別分析法(LDA)被廣泛地應用在模式分類問題上。主成分分析法(PCA)會最大化在原始高維空間中呈現高斯分布的樣本之間的相互距離。主成分分析法(PCA)在高斯分布數據的重建中得到最優化。然而,由于它不使用類標簽信息,主成分分析法(PCA)并不是一個用于分類的最佳選擇。費舍爾的線性判別分析法(LDA)找到一個投影方向使得類別間散布矩陣的跡最大的同時使類別內散布矩陣的跡最小。但是,LDA在實現中存在以下問題:1)忽略數據可能存在的非線性特點;2)假設所有的樣本對分類的貢獻相等;3)樣本少的情況下,性能下降嚴重。總的來說,這兩種方法只是在大樣本情況下各類模式識別問題中表現得較好,而在小樣本情況下的表現并不理想。
為了克服上述主成分分析法(PCA)和線性判別分析法(LDA)面臨的問題,新的線性算法,判別局部塊配準(DLA)算法被提出來用于分類問題。該算法分以下三個階段執行:1)部分最優化階段;2)整體配準階段。首先,每個數據塊都是由一個樣品和它的鄰近樣本組成,在這個局部數據塊內,需要相同類別的樣本盡量靠近,不同類別的樣本盡量遠離;在整體配準階段,實現方法是將加權后的部分最優校正到整體最優中。由于對本發明的理解需要到許多判別局部塊配準(DLA)算法的具體內容,下面對判別局部塊配準(DLA)算法的具體步驟進行較為詳細的介紹:
(1)部分最優:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華南理工大學,未經華南理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210396484.7/2.html,轉載請聲明來源鉆瓜專利網。





