[發明專利]一種去除特定字符串水印的方法及系統有效
| 申請號: | 202010943900.5 | 申請日: | 2020-09-09 |
| 公開(公告)號: | CN112070649B | 公開(公告)日: | 2022-07-22 |
| 發明(設計)人: | 成俊杰;呂晨;王永哲;房鵬展 | 申請(專利權)人: | 焦點科技股份有限公司 |
| 主分類號: | G06T1/00 | 分類號: | G06T1/00;G06T3/00;G06V30/413;G06F16/903;G06N3/04;G06N3/08 |
| 代理公司: | 南京瑞弘專利商標事務所(普通合伙) 32249 | 代理人: | 陳建和 |
| 地址: | 210032 江蘇省南京*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 去除 特定 字符串 水印 方法 系統 | ||
1.一種去除特定字符串水印的方法,其特征在于,將待處理圖片輸入到文字檢測模型,檢測是否存在字符串水印,若存在字符串水印,則將字符串所在圖片區域截取輸入文字識別模型中得到相應字符串,利用正則匹配是否存在特定字符串,若存在特定字符串,則將字符串所在圖片區域截取輸入生成網絡中,將該區域字符串去除,包括如下步驟:
步驟一:將待處理圖片輸入文字檢測模型,檢測是否存在字符串,若存在字符串,則返回字符串在圖片中位置坐標,若不存在字符串,則返回空;
所述步驟一中,采用CRAFT文字檢測模型對圖片中字符串進行檢測,若待處理圖片存在字符串,則返回字符串所在圖片中的坐標;所述CRAFT文字檢測模型檢測單個字符串及字符串間的連接關系,根據字符串間的連接關系確定文本行;
步驟二:若待處理圖片含有字符串,則根據步驟一中字符串坐標,在待處理圖片中截取相應字符串圖片,將字符串圖片輸入文字識別模型,得到相應字符串;
所述步驟二中,根據步驟一中檢測的字符串坐標,在待處理圖片中截取相應字符串圖片,將圖片等比例縮放到固定高度,輸入CRNN文字識別模型對字符串圖片進行識別,得到相應字符串,所述CRNN文字識別模型采用端到端的訓練;
步驟三:設定相應正則表達式,對步驟二中識別的字符串進行匹配,若匹配成功,則返回字符串所在圖片坐標;
步驟四:利用步驟三中匹配成功字符串的坐標,在待處理圖片中截取相應圖片,輸入去水印生成網絡,得到去除特定字符串水印的截圖,將去除水印的截圖還原到原待處理圖片中,得到完整的去除特定字符串水印的圖片;
所述步驟四中,所述去水印生成網絡為U-net生成網絡,訓練過程中,采用無水印的圖片作為目標圖,在無水印圖片上隨機生成相應數字水印作為輸入圖,構建輸入輸出均為256*256的U-net網絡結構,損失函數為L1損失,即逐元素間差值的平均絕對值,訓練目標為最小化L1損失,batch-size設定為64,epoch設定為20,初始學習率為0.001,并隨epoch衰減,訓練完成后,對于含有特定字符串的水印截圖,輸入U-net生成網絡,生成無水印的截圖。
2.如權利要求1所述的一種去除特定字符串水印的方法,其特征在于:所述步驟一中,對于一張H*W*3的3通道圖片,CRAFT文字檢測模型使用VGG網絡結構6stage,32倍下采樣,以不同的stage得到不同的特征圖,通過上采樣將不同的stage的特征圖進行融合得到H/2*W/2大小的預測圖,預測圖包括單字符中心區域的概率和相鄰字符區域中心的概率,后處理過程對0-1之間的概率進行取閾值計算,根據字符連接概率將文字區域連接,融合最小四邊形區域得到文字框。
3.如權利要求2所述的一種去除特定字符串水印的方法,其特征在于:所述步驟二中,根據所需去除的特定字符設定相應的字符字典,所述字符字典包括阿拉伯數字和符號,截取一定數量的圖片作為背景,在背景中根據字符字典生成相應訓練數據樣本,用于訓練CRNN文字識別模型,所述CRNN文字識別模型的輸入高度固定為64,利用resnet34網絡進行特征抽取,利用biLSTM在卷積特征基礎上提取文字序列特征,利用CTC對文字序列進行解碼,解決字符對齊問題,去除重復字符,得到對應字符串。
4.如權利要求3所述的一種去除特定字符串水印的方法,其特征在于:所述步驟三中,根據特定需求構建不同正則表達式,對步驟二中識別的字符串逐一運用正則匹配,若匹配成功,則返回字符串所在圖片坐標。
5.如權利要求4所述的一種去除特定字符串水印的方法,其特征在于:所述步驟四中,利用步驟三中匹配成功的特定字符串坐標,在待處理圖片中截取出特定字符串截圖,保存原先截圖尺寸信息,將截圖縮放尺寸到256*256,輸入去水印生成網絡,生成去除水印的圖片,再縮放回原先截圖尺寸,再根據原先截圖坐標,將去水印的截圖還原到原圖中。
6.如權利要求5所述的一種去除特定字符串水印的方法,其特征在于:所述步驟四中,所述隨epoch衰減具體為:每5個epoch縮小至原先學習率的1/5。
7.一種根據權利要求1-6之一所述方法運行的去除特定字符串水印的系統,其特征在于:包括依次相連的文字檢測模塊、文字識別模塊、特定字符串匹配模塊、去水印模塊和圖片還原模塊;
所述文字檢測模塊,用于檢測待處理圖片中是否存在字符串;
所述文字識別模塊,用于將檢測的字符串圖片識別轉換為字符串;
所述特定字符串匹配模塊,用于判斷所識別轉換的字符串是否為需求去除的特定字符串;
所述去水印模塊,用于將含有特定字符串的圖片中特定字符串去除;
所述圖片還原模塊,用于將已去除特定字符串的圖片還原到原圖中。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于焦點科技股份有限公司,未經焦點科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010943900.5/1.html,轉載請聲明來源鉆瓜專利網。





