[發明專利]一種基于深度學習的古印章篆文識別方法及系統在審
| 申請號: | 202210958287.3 | 申請日: | 2022-08-09 |
| 公開(公告)號: | CN115439863A | 公開(公告)日: | 2022-12-06 |
| 發明(設計)人: | 易堯華;涂超虎;陳婭婭;王凱麗;王新宇;韋豪東 | 申請(專利權)人: | 武漢大學 |
| 主分類號: | G06V30/19 | 分類號: | G06V30/19;G06V30/16;G06V30/12;G06V30/148;G06V10/82 |
| 代理公司: | 武漢科皓知識產權代理事務所(特殊普通合伙) 42222 | 代理人: | 羅飛 |
| 地址: | 430072 湖北省武*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 深度 學習 印章 篆文 識別 方法 系統 | ||
1.一種基于深度學習的古印章篆文識別方法,其特征在于,包括:
S1:獲取古代印章篆文識別數據集;
S2:人工合成古印章圖像,根據獲取的古代印章篆文識別數據集中包含的真實古印章圖像和人工合成的古印章圖像,構建手動生成的單字符數據集;
S3:對古代印章篆文識別數據集進行邊框去除和字符分割,得到分割后的單字符數據集;
S4:將手動生成的單字符數據集作為源域,采用預設深度神經網絡對手動生成的單字符數據集進行預訓練,獲取預訓練模型參數;
S5:對分割后的單字符數據集選擇最優的自動數據增強策略,獲取數據增強后的數據集;
S6:將預訓練模型參數作為初始參數值,在預設深度神經網絡上對所述數據增強后的數據集進行微調訓練,獲得古代印章篆文識別模型;
S7:用于利用古代印章篆文識別模型進行古印章篆文識別。
2.如權利要求1所述的深度學習的古印章篆文識別方法,其特征在于,步驟S2中人工合成古印章圖像,包括:
從獲取的古代印章篆文識別數據集中篩選古漢字篆體字體文件,以此合成所需字符的古漢字圖像;
對所述古漢字圖像隨機添加邊緣裁剪模擬字符位置變化,同時隨機進行顏色反轉處理模擬不同的篆刻形式;
通過控制參數大小對進行顏色反轉處理后的古漢字圖像隨機添加椒鹽噪聲和膨脹、腐蝕處理,用以模擬不同程度的圖像退化和字跡變化;
通過隨機添加印章上下左右四個方向的邊框等類似圖案模擬背景對字符的干擾。
3.如權利要求1所述的深度學習的古印章篆文識別方法,其特征在于,步驟S3對古代印章篆文識別數據集進行字符分割,包括:
使用OTSU算法對古代印章篆文識別數據集中的印章圖像進行二值化,利用開運算進行去噪處理;
根據去噪處理后圖像像素的投影特點,利用圖像邊緣像素的概率密度分布確定邊框寬度,去除印章邊框部分;
根據垂直像素投影特征、水平像素投影特征和字符個數,定位去邊框后圖像的兩個相鄰字符之間的分割點,采取先對列分割再對行分割的方式,進行單字符分割。
4.如權利要求1所述的深度學習的古印章篆文識別方法,其特征在于,步驟S4中的預設深度神經網絡為ResNet-50網絡。
5.如權利要求1所述的深度學習的古印章篆文識別方法,其特征在于,步驟S5中最優的數據增強策略的獲取方式為:
在預設深度神經網絡的迭代訓練中,將無偏驗證集與有偏數據集的分布相匹配,利用KL散度代替交叉熵損失自動估計數據增強的分布參數,其中,無偏驗證集為真實古印章圖像,有偏數據集為人工合成的古印章圖像;
根據分布參數自動估計選擇最優的數據增強策略,其中,數據增強策略包括數據增強操作類型、操作概率、操作幅度。
6.如權利要求1所述的深度學習的古印章篆文識別方法,其特征在于,步驟S6的微調訓練過程中,設定初始學習率和終止學習率,衰減方式使用指數衰減,利用RMSProp算法作為微調過程中的優化函數,同時與真實標簽對比,傳播軟標簽和損失權重以計算加權KL散度損失。
7.一種基于深度學習的古印章篆文識別系統,其特征在于,包括:
數據集獲取模塊,用于獲取古代印章篆文識別數據集;
單字符數據集生成模塊,用于人工合成古印章圖像,根據獲取的古代印章篆文識別數據集中包含的真實古印章圖像和人工合成的古印章圖像,構建手動生成的單字符數據集;
圖像前處理模塊,用于對古代印章篆文識別數據集進行邊框去除和字符分割,得到分割后的單字符數據集;
預訓練模塊,用于將手動生成的單字符數據集作為源域,采用預設深度神經網絡對手動生成的單字符數據集進行預訓練,獲取預訓練模型參數;
數據增強模塊,用于對分割后的單字符數據集選擇最優的自動數據增強策略,獲取數據增強后的數據集;
微調模塊,用于將預訓練模型參數作為初始參數值,在預設深度神經網絡上對所述數據增強后的數據集進行微調訓練,獲得古代印章篆文識別模型;
識別模塊,用于利用古代印章篆文識別模型進行古印章篆文識別。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于武漢大學,未經武漢大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210958287.3/1.html,轉載請聲明來源鉆瓜專利網。





