[發明專利]一種非標準字體的漢字自動符識別方法在審
| 申請號: | 201710383558.6 | 申請日: | 2017-05-26 |
| 公開(公告)號: | CN107316055A | 公開(公告)日: | 2017-11-03 |
| 發明(設計)人: | 顧亦熹;高沁瑤;高蘭英;高留其 | 申請(專利權)人: | 昆山遙矽微電子科技有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 南京縱橫知識產權代理有限公司32224 | 代理人: | 董建林 |
| 地址: | 215325 江蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 非標準 字體 漢字 自動 識別 方法 | ||
技術領域
本發明涉及漢字識別領域,涉及漢字分類器的訓練,屬于一種非 標準字體的漢字自動符識別方法。
背景技術
文字識別在當下方興未艾的物聯網領域有著越來越高的使用需 求,比如在輸入法、車牌識別、稅票識別和文獻錄入等實際用途中有 著極高的實用化需求,正確定位和識別這些文字對于基于內容的內容 檢索和信息過濾有著重要的意義。目前已經有不少的相關技術已經投 入到商業使用中,并且有些已經產生了較好的經濟效益。但是,絕大 部分文字識別技術都限制于某些特定的場景,比如智能識別印刷體漢 字。
根據實際應用的場景不同,目前主流的漢字識別算法主要分為兩 大類,即基于漢字筆畫跟蹤的方法和基于漢字圖片的方法。目前基于 漢字筆畫跟蹤的方法主要使用在中文輸入設備上,比如手機的手寫輸 入。然而,更多的實際應用環境下的非標準字體漢字的識別并不適用 該方法進行識別,因此基于圖片的漢字識別更適用于復雜環境下的非 標準字體的漢字識別。具體而言,待提取文字的圖像可以分為文檔圖 像、場景圖像和原生數字圖像三大類,其中后兩者更適用與復雜環境 下的非標準字體漢字的識別。場景圖像是指用攝像頭拍攝到的圖像, 場景中的文字信息也會作為場景的一部分被拍攝到場景圖像中,因此 場景圖像中的文字一般會淹沒在復雜的背景環境中,同時可能會存在 角度偏斜,光照不良以及無損缺失等情況;原生數字圖像則是計算機 按照一定的算法以數字形式保存的圖像信息,為了便于在網絡上傳播, 因此一般無法避免低分辨率的情況,且通常存在壓縮損失和邊緣柔化 不良的問題。
復雜條件下圖像文字提取系統的結構如圖1所示,包括文本定位, 文字分割和文字識別三大部分,其中文字識別是最為復雜,也是需求 最為迫切的一項技術。
發明內容
針對現有非標準字體漢字識別技術的不足,本發明提出了一種非 標準字體的漢字自動符識別方法。本發明的技術方案解決了復雜環境 下歡子存在的角度傾斜、光照不良、噪聲干擾、邊緣模糊、污損遮擋 等情況下的非標準字體的漢字識別問題。
為了解決上述技術問題,本發明采用如下技術方案:
一種非標準字體的漢字自動符識別方法,其特征在于,包括以下 步驟:
步序1:基于稀疏編碼得到待識別漢字圖像中的基向量和稀疏系數, 通過重構圖像實現濾除噪聲、處理邊緣柔化;
步序2:利用梯度方向平面直方圖抽取出復雜環境下待識別漢字邊緣 梯度特征并以此減輕影響漢字識別的負面作用;
步序3:將獲得的待識別的非標準字體的漢字的邊緣梯度特征輸入到 漢字分類器中,經行識別。
前述的一種非標準字體的漢字自動符識別方法,其特征在于,步 序1利用稀疏編碼得到的基向量和稀疏系數是通過多次訓練得到的, 在訓練階段,需要對目標函數進行優化求解:
minf(B,S)=[重構誤差]+β[稀疏懲罰因子]
式中,X=(x1,x2,x3,…,xn)表示訓練集中的n幅包含漢字的圖像 減去各自的平均灰度值后得到的m個k維向量的訓練數據集,其 中k為每幅圖像的像素數量,同樣的B=(b1,b2,b3,…,bn)表示經稀 疏編碼計算得到的n個k維稀疏系數向量;S表示稀疏系數矩陣, 每一列的Si為一副圖像的n維稀疏系數向量;β表示一個用來平 衡重構誤差和稀疏性的常數,Φ(Sij)表示非線性的稀疏懲罰函數, 因此懲罰函數可以表示為:
該目標函數為優化目標,原理是基于整個圖像求得所有的基向量B和 對應的稀疏系數S。
前述的一種非標準字體的漢字的識別方法,其特征在于,所述的 1中重新構建圖像的方法是根據基向量B對任意的一個待識別漢字的 圖像I中求取它的稀疏系數,然后再根據Inew(x,y)=BS+t進行重構 得到復原圖像Inew,上式中t為圖像I的平均灰度值。
前述的一種非標準字體的漢字的識別方法,其特征在于,步序2 需要在步驟1中構建的復原圖像上提取梯度方向直方圖的特征,具體 為:
(a)需要計算點(x,y)的梯度幅值G(x,y)和方向θ(x,y),具體 的計算公式如下,
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于昆山遙矽微電子科技有限公司,未經昆山遙矽微電子科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710383558.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:天氣信息實時顯示方法及移動終端
- 下一篇:時間管理方法及裝置





