[發(fā)明專利]一種基于深度學習的二維碼定位識別系統(tǒng)及方法在審
| 申請?zhí)枺?/td> | 201910043520.3 | 申請日: | 2019-01-17 |
| 公開(公告)號: | CN109858305A | 公開(公告)日: | 2019-06-07 |
| 發(fā)明(設(shè)計)人: | 吳凡;郭驍 | 申請(專利權(quán))人: | 柳州康云互聯(lián)科技有限公司 |
| 主分類號: | G06K7/14 | 分類號: | G06K7/14;G06N3/04 |
| 代理公司: | 北京律譜知識產(chǎn)權(quán)代理事務所(普通合伙) 11457 | 代理人: | 李硯明 |
| 地址: | 545000 廣西壯族自治區(qū)柳*** | 國省代碼: | 廣西;45 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 二維碼 訓練模塊 采集模塊 學習模塊 定位識別系統(tǒng) 多層神經(jīng)網(wǎng)絡(luò) 分類器模型 訓練圖片 數(shù)據(jù)集 標注 采集 標準化處理 標準化數(shù)據(jù) 拍攝位置 分類器 放入 構(gòu)建 學習 保存 檢測 更新 圖片 | ||
1.一種基于深度學習的二維碼定位識別系統(tǒng),其特征在于包括,采集模塊,該采集模塊用于預先采集大量的包含二維碼的圖片;還包括標注模塊,所述標注模塊將每張圖片進行標準化處理,記錄其中的二維碼的大小及位置;數(shù)據(jù)庫模塊,用于將所述二維碼的大小和位置信息存儲在數(shù)據(jù)庫模塊中;還包括預訓練圖片數(shù)據(jù)集采集模塊和深度學習模塊,所述深度學習模塊用于搭建多層神經(jīng)網(wǎng)絡(luò);還包括預訓練模塊,該預訓練模塊使用上述預訓練圖片數(shù)據(jù)集采集模塊采集到的數(shù)據(jù)放入到所構(gòu)建的深度學習模塊的多層神經(jīng)網(wǎng)絡(luò)中進行訓練,保存訓練得到的分類器模型及對應的參數(shù)值;還包括標準化數(shù)據(jù)生成模塊,該標準化數(shù)據(jù)生成模塊從所述數(shù)據(jù)庫模塊中讀取采集到的所有圖片及標注信息,生成訓練所需的規(guī)范化數(shù)據(jù);還包括訓練模塊,該訓練模塊將標準化數(shù)據(jù)生成模塊生成的規(guī)范化數(shù)據(jù)提交至預訓練模塊預訓練好的分類器模型進行訓練,并更新其參數(shù),從而獲得訓練完成的二維碼檢測分類器。
2.根據(jù)權(quán)利要求1所述的一種基于深度學習的二維碼定位識別系統(tǒng),其特征在于還包括識別模塊,該識別模塊用于識別載入的圖像;所述二維碼檢測分類器識別所述圖像中是否存在二維碼;還包括二維碼識別模塊,如果所述二維碼檢測分類器檢測到存在二維碼,則將檢測到的二維碼區(qū)域裁剪出來,針對該區(qū)域進行二維碼識別,并返回二維碼識別的結(jié)果。
3.根據(jù)權(quán)利要求2所述的基于深度學習的二維碼定位識別系統(tǒng),其特征在于,還包括標準化數(shù)據(jù)生成模塊生成訓練所需的規(guī)范化數(shù)據(jù)包括:圖片高度、寬度、是否存在二維碼,如果存在二維碼,二維碼的大小及位置。
4.根據(jù)權(quán)利要求1-3任意一項所述的基于深度學習的二維碼定位識別系統(tǒng),其特征在于,所述多層神經(jīng)網(wǎng)絡(luò)包括以下層:
第一層為卷積層,預定輸入維數(shù)為416x416x3,卷積核大小3x3,步長為1,卷積核數(shù)量為16,輸出維數(shù)為416x416x16;
第二層為池化層,預定輸入維數(shù)為416x416x16,池化核大小為2x2,步長為2,使用maxpool方法,輸出維數(shù)為208x208x16;
第三層為卷積層,預定輸入維數(shù)為208x208x16,卷積核大小3x3,步長為1,卷積核數(shù)量為32,輸出維數(shù)為208x208x32;
第四層為池化層,預定輸入維數(shù)為208x208x32,池化核大小為2x2,步長為2,使用maxpool方法,輸出維數(shù)為104x104x32;
第五層為卷積層,預定輸入維數(shù)為104x104x32,卷積核大小為3x3,步長為1,卷積核數(shù)量為64,輸出維數(shù)為104x104x64;
第六層為池化層,預定輸入維數(shù)為104x104x64,池化核大小為2x2,步長為2,使用maxpool方法,輸出維數(shù)為52x52x64;
第七層為卷積層,預定輸入維數(shù)為52x52x64,卷積核大小為3x3,步長為1,卷積核數(shù)量為128,輸出維數(shù)為52x52x128;
第八層為池化層 預定輸入維數(shù)為52x52x128,池化核大小為2x2,步長為2,使用maxpool方法,輸出維數(shù)為26x26x128;
第九層為卷積層 預定輸入維數(shù)為26x26x128,卷積核大小為3x3,步長為1,卷積核數(shù)量為256,輸出維數(shù)為26x26x256;
第十層為池化層,預定輸入維數(shù)為26x26x256,池化核大小為2x2,步長為2,使用maxpool方法,輸出維數(shù)為13x13x256;
第十一層為卷積層,預定輸入維數(shù)為13x13x256,卷積核大小為3x3,步長為1,卷積核數(shù)量為512,輸出維數(shù)為13x13x512;
第十二層為卷積層,預定輸入維數(shù)為13x13x512,卷積核大小為3x3,步長為1,卷積核數(shù)量為1024,輸出維數(shù)13x13x1024;
第十三層為卷積層,預定輸入維數(shù)為13x13x1024,卷積核大小為3x3,步長為1,卷積核數(shù)量為1024,輸出維數(shù)為13x13x1024;
第十四層為卷積層,預定輸入維數(shù)為13x13x1024,卷積核大小為1x1,步長為1,卷積核數(shù)量為30,輸出維數(shù)為13x13x30;
第十五層為輸出結(jié)果層,預定輸入維數(shù)為13x13x30,輸出結(jié)果為檢測的結(jié)果,位置,大小。
5.根據(jù)權(quán)利要求4所述的基于深度學習的二維碼定位識別系統(tǒng),其特征在于,所述預訓練模塊使用上述預訓練圖片數(shù)據(jù)集采集模塊采集到的數(shù)據(jù)放入到所構(gòu)建的深度學習模塊的多層神經(jīng)網(wǎng)絡(luò)的前十三層進行訓練,使其在預訓練圖片數(shù)據(jù)集上Top-5識別分類準確率達到88%。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于柳州康云互聯(lián)科技有限公司,未經(jīng)柳州康云互聯(lián)科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910043520.3/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





