[發明專利]自動識別原始文檔的翻拍圖像的訓練方法和檢測方法有效
| 申請號: | 201910955950.2 | 申請日: | 2019-10-09 |
| 公開(公告)號: | CN110717450B | 公開(公告)日: | 2023-02-03 |
| 發明(設計)人: | 陳昌盛;藍鋒博;黃繼武 | 申請(專利權)人: | 深圳大學 |
| 主分類號: | G06V30/41 | 分類號: | G06V30/41;G06V30/19;G06V30/12;G06V30/148;G06V10/82;G06N3/0464;G06N3/08 |
| 代理公司: | 深圳舍穆專利代理事務所(特殊普通合伙) 44398 | 代理人: | 黃賢炬 |
| 地址: | 518060 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 自動識別 原始 文檔 翻拍 圖像 訓練 方法 檢測 | ||
1.一種自動識別原始文檔的翻拍圖像的訓練方法,其特征在于,
包括:
構建由多張來源于原始文檔的圖像組成的圖像數據庫,所述圖像數據庫包括訓練數據子集和測試數據子集,所述訓練數據子集具有包括初始圖像和翻拍圖像的訓練圖像和與所述訓練圖像關聯的標注結果,所述測試數據子集包括測試圖像和與所述測試圖像關聯的標注結果,
其中,利用第一采集設備對所述原始文檔進行掃描或拍攝獲得所述初始圖像,將所述初始圖像打印至實物載體上得到打印圖像,利用第二采集設備對所述打印圖像進行掃描或拍攝獲得所述翻拍圖像,若所述第二采集設備是手機,則將所述圖像數據庫中相應的圖像劃分為手機數據集,若所述第二采集設備是掃描儀,則將所述圖像數據庫中相應的圖像劃分為掃描儀數據集,由手機獲得的圖像的圖像質量低于由掃描儀獲得的圖像的圖像質量;
獲取初始卷積神經網絡,所述初始卷積神經網絡是利用現有圖像數據集進行訓練得到的卷積神經網絡,所述現有圖像數據集為ImageNet數據集,所述初始卷積神經網絡的卷積層、池化層和全連接層經過所述ImageNet數據集的訓練獲得初始目標權重;并且
利用所述訓練數據子集對所述初始卷積神經網絡進行微調訓練,從而獲得能夠輸出所述原始文檔的訓練圖像的分類結果的目標卷積神經網絡,所述微調訓練包括凍結所述初始卷積神經網絡的全連接層之前的初始目標權重,利用所述訓練數據子集重新訓練所述全連接層的權重,以得到具有目標權重的全連接層,進而基于具有所述初始目標權重的卷積層和池化層以及具有所述目標權重的全連接層獲得所述目標卷積神經網絡,
其中,所述訓練數據子集來源于所述手機數據集且所述測試數據子集來源于所述掃描儀數據集,進而使所述初始卷積神經網絡在所述手機數據集上訓練而捕捉圖像細節并使所述目標卷積神經網絡在所述掃描儀數據集上測試。
2.如權利要求1所述的訓練方法,其特征在于,
還包括測試步驟:
將所述測試數據子集輸入所述目標卷積神經網絡獲得分類結果;基于所述分類結果獲得受試者工作特征曲線、置信度和等錯誤率;基于所述置信度和所述等錯誤率測試所述目標卷積神經網絡的性能;且若所述置信度和所述等錯誤率不滿足預設要求,則繼續利用所述訓練數據子集訓練所述目標卷積神經網絡,
重復所述測試步驟,直至所述置信度和所述等錯誤率滿足預設要求。
3.如權利要求1所述的訓練方法,其特征在于,
對所述圖像數據庫中的多張所述圖像進行分割獲得多個圖像塊,每個所述圖像塊的像素尺寸與所述卷積神經網絡匹配。
4.如權利要求1所述的訓練方法,其特征在于,
所述圖像數據庫中的多張所述圖像利用具有成像系統的采集設備獲得。
5.如權利要求1所述的訓練方法,其特征在于,
所述初始卷積神經網絡選自DenseNet121、DenseNet169、DenseNet201、InceptionV3、InceptionResNetV2、MobileNet、ResNeXt101、ResNeXt50、ResNet101V2、ResNet101、ResNet152V2、ResNet152、ResNet50V2、ResNet50、VGG16、VGG19或Xception中的任一個。
6.一種自動識別原始文檔的翻拍圖像的檢測方法,其特征在于,
包括:
利用權利要求1至5中的任一項所述的訓練方法訓練卷積神經網絡模塊中的初始卷積神經網絡,以獲得目標卷積神經網絡;
獲取來源于原始文檔的目標圖像;并且
利用所述卷積神經網絡模塊對所述目標圖像進行檢測,確定所述目標圖像是否為翻拍圖像。
7.如權利要求6所述的檢測方法,其特征在于,
對所述目標圖像進行分割處理,獲得多個圖像塊;
利用所述卷積神經網絡模塊檢測各個所述圖像塊;
基于各個所述圖像塊的分類結果,確定所述目標圖像是否為所述翻拍圖像。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳大學,未經深圳大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910955950.2/1.html,轉載請聲明來源鉆瓜專利網。





