[發明專利]一種非標準字體的漢字自動符識別方法在審
| 申請號: | 201710383558.6 | 申請日: | 2017-05-26 |
| 公開(公告)號: | CN107316055A | 公開(公告)日: | 2017-11-03 |
| 發明(設計)人: | 顧亦熹;高沁瑤;高蘭英;高留其 | 申請(專利權)人: | 昆山遙矽微電子科技有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 南京縱橫知識產權代理有限公司32224 | 代理人: | 董建林 |
| 地址: | 215325 江蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 非標準 字體 漢字 自動 識別 方法 | ||
1.一種非標準字體的漢字自動符識別方法,其特征在于,包括以下步驟:
步序1:基于稀疏編碼得到待識別漢字圖像中的基向量和稀疏系數,通過重構圖像實現濾除噪聲、處理邊緣柔化;
步序2:利用梯度方向平面直方圖抽取出復雜環境下待識別漢字邊緣梯度特征并以此減輕影響漢字識別的負面作用;
步序3:將獲得的待識別的非標準字體的漢字的邊緣梯度特征輸入到漢字分類器中,經行識別。
2.根據權利要求1所述的一種非標準字體的漢字自動符識別方法,其特征在于,步序1利用稀疏編碼得到的基向量和稀疏系數是通過多次訓練得到的,在訓練階段,需要對目標函數進行優化求解:
式中,X=(x1,x2,x3,…,xn)表示訓練集中的n幅包含漢字的圖像減去各自的平均灰度值后得到的m個k維向量的訓練數據集,其中k為每幅圖像的像素數量,同樣的B=(b1,b2,b3,…,bn)表示經稀疏編碼計算得到的n個k維稀疏系數向量;S表示稀疏系數矩陣,每一列的Si為一副圖像的n維稀疏系數向量。β表示一個用來平衡重構誤差和稀疏性的常數,Φ(Sij)表示非線性的稀疏懲罰函數,因此懲罰函數可以表示為:
該目標函數為優化目標,原理是基于整個圖像求得所有的基向量B和對應的稀疏系數S。
3.根據權利要求2所述的一種非標準字體的漢字的識別方法,其特征在于,所述的1中重新構建圖像的方法是根據基向量B對任意的一個待識別漢字的圖像I中求取它的稀疏系數,然后再根據Inew(x,y)=BS+t進行重構得到復原圖像Inew,上式中t為圖像I的平均灰度值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于昆山遙矽微電子科技有限公司,未經昆山遙矽微電子科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710383558.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:天氣信息實時顯示方法及移動終端
- 下一篇:時間管理方法及裝置





