[發明專利]一種非標準字體的漢字自動符識別方法在審

申請號：	201710383558.6	申請日：	2017-05-26
公開（公告）號：	CN107316055A	公開（公告）日：	2017-11-03
發明（設計）人：	顧亦熹;高沁瑤;高蘭英;高留其	申請（專利權）人：	昆山遙矽微電子科技有限公司
主分類號：	G06K9/62	分類號：	G06K9/62
代理公司：	南京縱橫知識產權代理有限公司32224	代理人：	董建林
地址：	215325 江蘇***	國省代碼：	江蘇;32
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	一種非標準字體漢字自動識別方法
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【權利要求書】：

1.一種非標準字體的漢字自動符識別方法，其特征在于，包括以下步驟：

步序1：基于稀疏編碼得到待識別漢字圖像中的基向量和稀疏系數，通過重構圖像實現濾除噪聲、處理邊緣柔化；

步序2：利用梯度方向平面直方圖抽取出復雜環境下待識別漢字邊緣梯度特征并以此減輕影響漢字識別的負面作用；

步序3：將獲得的待識別的非標準字體的漢字的邊緣梯度特征輸入到漢字分類器中，經行識別。

2.根據權利要求1所述的一種非標準字體的漢字自動符識別方法，其特征在于，步序1利用稀疏編碼得到的基向量和稀疏系數是通過多次訓練得到的，在訓練階段，需要對目標函數進行優化求解：

式中，X＝(x₁,x₂,x₃,…,x_n)表示訓練集中的n幅包含漢字的圖像減去各自的平均灰度值后得到的m個k維向量的訓練數據集，其中k為每幅圖像的像素數量，同樣的B＝(b₁,b₂,b₃,…,b_n)表示經稀疏編碼計算得到的n個k維稀疏系數向量；S表示稀疏系數矩陣，每一列的S_i為一副圖像的n維稀疏系數向量。β表示一個用來平衡重構誤差和稀疏性的常數，Φ(S_ij)表示非線性的稀疏懲罰函數，因此懲罰函數可以表示為：

Φ(Sij)=(Sij2+ϵ)12]]>