[發明專利]一種基于卷積神經網絡的工業字符識別方法有效
| 申請號: | 201611235492.8 | 申請日: | 2016-12-28 |
| 公開(公告)號: | CN106650721B | 公開(公告)日: | 2019-08-13 |
| 發明(設計)人: | 吳曉軍;張瑞 | 申請(專利權)人: | 吳曉軍 |
| 主分類號: | G06K9/20 | 分類號: | G06K9/20;G06K9/62;G06N3/04 |
| 代理公司: | 深圳市科吉華烽知識產權事務所(普通合伙) 44248 | 代理人: | 經國富 |
| 地址: | 518000 廣東省深*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 卷積 神經網絡 工業 字符 識別 方法 | ||
本發明提出了一種基于卷積神經網絡的工業字符識別方法,包括建立字符數據集,對字符數據集進行數據增強及預處理,建立CNN集成模型,所述模型包含3個不同的個體分類器,然后,利用模型進行訓練,訓練分為兩步完成,第一步為離線訓練,獲取離線訓練模型,第二步為在線訓練,將離線訓練模型用作初始化,進行特定生產線字符數據集的訓練,獲取在線訓練模型;以及對目標圖形進行預處理、字符定位和單個字符圖像分割;將分割好的字符圖像送入已訓練好的在線訓練模型中,得到CNN集成模型中三個分類器將單個目標圖像分類為每個類別的概率值;采用投票的方式進行最終決策,得到測試數據的類別結果。本發明能夠對不同生產線上的字符進行快速、高效的識別。
技術領域
本發明涉及圖像識別技術領域,尤其涉及一種工業字符識別方法。
背景技術
現有的字符識別技術一般采用基于模版匹配或基于結構統計的算法。以字符圖像灰度作為匹配信息,通過計算字符模板圖像與目標圖像子區域的灰度相關系數來度量匹配度;或利用字符本身的形態結構,如邊緣、拐點、連通域等特征進行識別。還有一類是在建立字符圖像的特征后,通過有監督的方式學習特征與目標類別之間的關系,建立從輸入到預測輸出的函數關系。
專利文獻1(中國專利公開號CN101436249A)公開了一種獲得字符粗分類及細分類匹配模版的方法,用于手寫字符識別系統。專利文獻2(中國專利公開號CN103049750A)公開了一種采用邊緣特征建立字符匹配模版的方法。專利文獻3(中國專利公開號CN104820827A)公開了一種通過二值化、預處理、區域粗提取和分割等各個操作獲取字符的單獨圖像與設定的模版進行相似性度量的匹配算法,用于電線電纜表面的點狀字符識別。專利文獻4(中國專利公開號CN105761351A)公開了一種基于結構特征的字符識別方法。專利文獻5(中國專利公開號CN104871180A)公開了一種使用相同文本的多個圖像改善文本辨識的方法用于改善文字識別效果。專利文獻6(中國專利公開號CN105608453A)公開了一種能夠對包括不同種類字符的復式記錄的票據進行高精度識別的字符識別系統及字符識別方法。專利文獻7(中國專利公開號CN103902956A)公開了一種基于神經網絡的車牌照字符識別方法,以字符圖像在X軸和Y軸上的投影為基本,對其做Fourier變換得到的K個變換系數中選出有代表性的M個特征作為神經網絡的輸入,采用有監督的方式訓練得到特征和輸出類別間的關系。專利文獻8(中國專利公開號CN101408933A)公開了一種基于粗網格特征提取和BP神經網絡的車牌字符識別方法。專利文獻9(中國專利公開號CN103927534A)公開了針對易拉罐底噴碼字符的在線視覺檢測方法,包括離線狀態下對圖像中的字符進行分割,并歸類構建字符庫,采用卷積神經網絡算法進行訓練,形成字符分類器,在在線檢測時用同樣的過程對輸入圖像進行識別。專利文獻10(中國專利公開號CN104463209A)公開了一種識別PCB板上數字代碼的方法,采用頻域法得到增強了特征值的圖像,歸一化特征值輸入BP神經網絡完成訓練和預測。專利文獻11(中國專利公開號CN104331688 A)公開了一種雷管外殼點陣字符的識別方法,利用連通域對單個字符區域進行切分,將字符邊界到區域邊界的距離作為待識別的特征值,利用最小距離分類器和多級識別法獲得最終的識別結果。專利文獻12(中國專利公開號CN105678293A)、專利文獻13(中國專利公開號CN105678292A)公開了一種基于卷積及遞歸神經網絡的文字序列識別系統,采用CNN提取圖像文字序列特征并輸出到RNN中,依次實現漢字前、后部分、數字、字母、標點符號或者空白的識別。王有旺等提出了基于深度學習的字符識別算法,分別應用于手寫體漢字識別和自然場景英文文字識別(王有旺,深度學習及其在手寫漢字識別中的應用研究,華南理工大學,碩士學位論文,2014;廖威敏,面向自然場景的端對端英文文字識別研究,廈門大學,碩士學位論文,2014)。周鳳香提出了一種基于字符混合特征的工業生產線標簽識別系統,通過提取字符的孔洞特征、統計特征、結構特征和基于Gabor變換的紋理特征等構建字符的混合特征,設計三層分類器進行遞進的識別分類(周鳳香,工業生產線標簽字符識別系統的設計與實現,電子科技大學,碩士學位論文,2013)。劉萌萌提出了一種基于神經網絡的壓印字符識別系統,其中研究了模版匹配定位算法和基于Ostu法的字符分割方法,然后結合BP神經網絡和字符的結構特征構建了完整的字符識別方案(劉萌萌,基于神經網絡的壓印字符識別系統研究,天津大學,碩士學位論文,2013)。國外的機器視覺軟件例如美國康耐視的VisionPro、日本Keyence、德國MVtec的Halcon等都具有字符識別算法,一方面這些方法都是基于傳統的技術實現,另一方面我們需要開發具有自主知識產權的核心技術,隨著“中國制造2025”計劃的實施,亟需掌握高性能的機器視覺核心算法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于吳曉軍,未經吳曉軍許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611235492.8/2.html,轉載請聲明來源鉆瓜專利網。





