[發明專利]一種基于深度學習的手寫體數字識別方法及系統在審
| 申請號: | 201610126470.1 | 申請日: | 2016-03-04 |
| 公開(公告)號: | CN107153810A | 公開(公告)日: | 2017-09-12 |
| 發明(設計)人: | 丁世飛;侯艷路 | 申請(專利權)人: | 中國礦業大學 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/66;G06N3/04;G06N3/06 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 221116 江蘇省徐州市*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 深度 學習 手寫體 數字 識別 方法 系統 | ||
1.一種基于卷積神經網絡的手寫體數字識別方法,其特征在于,通過構建帶有標簽的手寫體數字圖片作為樣本集對卷積神經網絡進行訓練,將訓練好的卷積神經網絡保存,將待識別圖片作為輸入,根據輸出向量得到識別結果。
2.根據權利要求1所述的方法,其特征是,所述的樣本集是:根據可能出現的書寫狀況,不同的書寫習慣,盡可能有偏差的書寫,制作手寫數字圖像的訓練集和標簽集,并將彩色圖像轉化為灰度圖像,把得到的灰度圖像尺寸歸一化為28*28大小。
3.根據權利要求1所述的方法,其特征是,所述的卷積神經網絡為多層神經網絡,包括輸入層、兩個卷積層、兩個降采樣層、一個全連接層和一個輸出層,其中:輸入層是28*28的灰度圖像,卷積層C1有6張特征圖,降采樣層S2有6張特征圖,卷積層C3由S2的6張特征圖經卷積后全連接而得12張特征圖,降采樣層S4有12張特征圖,全連接層將S4的12張特征圖排列,設置192個節點,輸出層設置為10個節點。
4.根據權利要求1所述的方法,其特征是,所指的訓練是指:將樣本集(包括手寫數字圖像和標簽)輸入到設置好的卷積神經網絡,結合反向傳播BP算法調整參數和偏置,完成對卷積神經網絡的訓練。
5.根據權利要求1或4所述的方法,其特征是,所述的訓練包括:
1:對卷積神經網絡初始化:用不同的小隨機數(0-1之間)對可訓練參數初始化,對偏置初始化為0;
2:向卷積神經網絡輸入2000個訓練樣本來訓練網絡,并得到輸出向量;
3:計算殘差,結合反向傳播BP算法更新可調整參數和偏置。
6.根據權利要求5所述的方法,其特征是,所述的訓練樣本包括:輸入向量和標簽,輸入向量經過逐層變換,在輸出層輸出,得到實際輸出向量。
7.根據權利要求1所述的方法,其特征是,所述的識別包括:將待識別手寫體數字圖片輸入訓練好的卷積神經網絡中,得到輸出向量從而識別出數字的類別。
8.根據權利要求1或7所述的方法,其特征是,所述的識別包括:
1:在系統的手寫板中寫完數字保存之后,進行灰度化,歸一化預處理;
2:得到預處理之后的圖片,輸入到已經訓練保存好的卷積神經網絡中,等待輸出,取輸出向量最大值得行號為識別結果,即完成對手寫數字的識別。
9.一種實現上述任一權利要求所述方法的系統,其特征在于:訓練樣本制作模塊、數字手寫模塊、卷積神經網絡模塊及手寫數字識別模塊,其中訓練樣本制作模塊的訓練樣本輸入卷積神經網絡,把卷積神經網絡訓練成一個能識別數字0-9的分類器,手寫數字識別模塊得到數字手寫模塊的圖像并輸入訓練好的卷積神 經網絡來進行識別。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國礦業大學,未經中國礦業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610126470.1/1.html,轉載請聲明來源鉆瓜專利網。





