[發明專利]基于深度卷積神經網絡的脫機手寫漢字識別方法在審
| 申請號: | 201710855035.7 | 申請日: | 2017-09-20 |
| 公開(公告)號: | CN107590497A | 公開(公告)日: | 2018-01-16 |
| 發明(設計)人: | 趙輝;王艷美;劉真三 | 申請(專利權)人: | 重慶郵電大學 |
| 主分類號: | G06K9/32 | 分類號: | G06K9/32;G06K9/46;G06K9/62;G06N3/02 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 400065 重*** | 國省代碼: | 重慶;85 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 深度 卷積 神經網絡 脫機 手寫 漢字 識別 方法 | ||
1.一種基于深度卷積神經網絡的脫機手寫漢字識別的方法,其特征在于包括如下步驟:
在Windows上搭建TensorFlow深度學習框架;
準備數據集,將數據集轉化為TensorFlow的輸入形式,并將圖片進行歸一化預處理;
在TensorFlow環境下搭建反向合成空間變換網絡以及深度的卷積神經網絡,采用反向合成空間網絡對手寫漢字進行扭曲形變,得到糾正和對齊。并將其輸出作為卷積神經網絡的輸入;
最后采用大量的數據對反向合成空間變換網絡和卷積神經網絡形成的網絡進行訓練、測試。并通過TensorBoard工具對網絡處理過程中的圖片及最終測試結果可視化,分析其作用,并對比識別效果。
2.根據權利要求書1所述步驟,使用反向合成空間變換對手寫漢字進行糾正,其特征在于:
采用扭曲參數組成的齊次矩陣對原圖像進行變換對齊,扭曲參數以仿射方式為例,參數p=[p1 p2 p3 p4 p5 p6],對應的齊次變換矩陣:
將其作用在圖像上,對圖像I(x)進行扭曲形變,包括圖像的旋轉,平移、放縮等操作。
ImWarp(x)=I(x)·W(p)
ImWarp(x)即為糾正過的圖片。參數p是采用迭代的方式進行更新求取,而且p的扭曲增量Δp是由一個卷積神經網絡或者神經網絡計算而來,本發明將此網絡稱為幾何預測器。由于反向合成空間變換原理受反向合成Lucas-Kanade算法的啟發:
經過一系列的推到和轉化,其解為:
Δp=R·I(p)+b
最終解是線性回歸形式,所以可以將其求解過程參數化為神經網絡或者卷積神經網絡;
求扭曲增量Δp的幾何預測器的網絡結構有三種方案,兩個方案是卷積神經網絡結構,一個為單層的神經網絡。說明書中有詳細的結構說明。我們最終會逐一驗證每個方案并分析其有效性。
幾何預測器更新的Δp與之前的p合成,更新參數p。之后可以將更新的p值從新作用在圖像上,循環迭代求取最佳的p值。根據合成定義,更新方式如下:
采用合成的方式來更新參數的好處是不必每次都去求樣本圖像的梯度。大大加快了反向傳播的計算速度。
最后將經過糾正的圖片輸入到卷積神經網絡中進行特征提取與分類。卷積神經網絡的結構順序分別為:兩個卷積層、一個池化層、接著兩個卷積層、一個池化,最后是兩個全連接層。最終的輸出神經元個數與本發明實例的類別相同。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于重慶郵電大學,未經重慶郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710855035.7/1.html,轉載請聲明來源鉆瓜專利網。





