[發明專利]基于深度學習技術的滿文文檔印章提取與去除方法有效
| 申請號: | 201811100870.0 | 申請日: | 2018-09-20 |
| 公開(公告)號: | CN109359550B | 公開(公告)日: | 2021-06-22 |
| 發明(設計)人: | 賀建軍;盧海濤;鄭蕊蕊;劉文鵬;周建云 | 申請(專利權)人: | 大連民族大學 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06T3/00;G06N3/04;G06N3/08 |
| 代理公司: | 大連智高專利事務所(特殊普通合伙) 21235 | 代理人: | 馬慶朝;張欽 |
| 地址: | 116600 遼寧省*** | 國省代碼: | 遼寧;21 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 深度 學習 技術 滿文 文檔 印章 提取 去除 方法 | ||
1.一種基于深度學習技術的滿文文檔印章提取與去除方法,其特征在于,步驟如下:
S1、對滿文文檔圖像進行預處理;
S2、訓練與保存提取印章的對抗生成網絡:
S2.1、構建具有U-net結構的生成器G1;
S2.2、在生成器G1中,輸入圖像經過若干次卷積、leakyReLU操作、BN層操作得到若干個網絡層;
S2.3、步驟S2.2中最后一個網絡層經過上采樣UpSampling2D操作、卷積、Dropout層操作、BN層操作、連接倒數第二個網絡層后得到u1層;
S2.4、u1層經過若干次上采樣UpSampling2D操作、卷積、Dropout層操作、BN層操作、連接網絡層操作得到網絡輸出圖像;
S2.5、構建具有二分類的卷積神經網絡的判別器D1,將生成器G1生成的網絡輸出圖像與真實圖片一同送入判別器D1;
S2.6、定義目標損失函數:
其中:x為待處理的圖像矩陣,y為它的監督圖像矩陣,z為符合高斯分布的與x,y大小相同的隨機矩陣,z矩陣每一像素取值范圍是[0,255],D1為判斷器,G1為生成器,λ為可調超參數,取值范圍為[0,1];
S2.7、保存訓練好的對抗生成網絡模型;
S3、訓練與保存去除印章的對抗生成網絡:
S3.1、構建具有U-net結構的生成器G1;
S3.2、在生成器G1中,輸入圖像經過若干次卷積、leakyReLU操作、BN層操作得到若干個網絡層;
S3.3、步驟S3.2中最后一個網絡層經過上采樣UpSampling2D操作、卷積、Dropout層操作、BN層操作、連接倒數第二個網絡層后得到u1層;
S3.4、u1層經過若干次上采樣UpSampling2D操作、卷積、Dropout層操作、BN層操作、連接網絡層操作得到網絡輸出圖像;
S3.5、構建具有二分類的卷積神經網絡的判別器D1,將生成器G1生成的網絡輸出圖像與真實圖片一同送入判別器D1;
S3.6、定義目標損失函數:
其中:x為待處理的圖像矩陣,y為它的監督圖像矩陣,z為符合高斯分布的與x,y大小相同的隨機矩陣,z矩陣每一像素取值范圍是[0,255],D1為判斷器,G1為生成器,λ為可調超參數,取值范圍為[0,1];
S3.7、保存訓練好的對抗生成網絡模型。
2.如權利要求1所述的基于深度學習技術的滿文文檔印章提取與去除方法,其特征在于,步驟S1中預處理具體步驟如下:
S1.1、將圖像進行歸一化操作;
S1.2、準備為訓練提取印章的對抗生成網絡和去除印章的對抗生成網絡的數據。
3.如權利要求1所述的基于深度學習技術的滿文文檔印章提取與去除方法,其特征在于,還包括以下步驟:
S4、對對抗生成網絡模型進行驗證和測試。
4.如權利要求2所述的基于深度學習技術的滿文文檔印章提取與去除方法,其特征在于,用提取印章的對抗生成網絡的數據組成驗證集驗證提取印章的對抗生成網絡模型,并微調網絡參數得到最終的提取印章的對抗生成網絡模型,保存新模型用于對新的樣本進行測試;用去除印章的對抗生成網絡的數據組成驗證集驗證去除印章的對抗生成網絡模型,并微調網絡參數得到最終的去除印章的對抗生成網絡模型,保存新模型用于對新的樣本進行測試。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于大連民族大學,未經大連民族大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811100870.0/1.html,轉載請聲明來源鉆瓜專利網。





