[發明專利]一種去除特定字符串水印的方法及系統有效
| 申請號: | 202010943900.5 | 申請日: | 2020-09-09 |
| 公開(公告)號: | CN112070649B | 公開(公告)日: | 2022-07-22 |
| 發明(設計)人: | 成俊杰;呂晨;王永哲;房鵬展 | 申請(專利權)人: | 焦點科技股份有限公司 |
| 主分類號: | G06T1/00 | 分類號: | G06T1/00;G06T3/00;G06V30/413;G06F16/903;G06N3/04;G06N3/08 |
| 代理公司: | 南京瑞弘專利商標事務所(普通合伙) 32249 | 代理人: | 陳建和 |
| 地址: | 210032 江蘇省南京*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 去除 特定 字符串 水印 方法 系統 | ||
本發明公開了一種去除特定字符串水印的方法及系統,其特征在于,將待處理圖片輸入到文字檢測模型,檢測是否存在字符串水印,若存在字符串水印,則將字符串所在圖片區域截取輸入文字識別模型中得到相應字符串,利用正則匹配是否存在特定字符串,利用U?net生成網絡將含字符串水印的圖片生成為去除字符串水印的圖片,再將原圖還原,有助于規避風險,高效的解決去除特定字符串水印的問題,保證網站圖片符合搜索引擎優化規則,同時可以隨時調整規則,快速應用,無需用戶或網站編輯操作,極大的提高了效率,提高了用戶體驗與網站整體質量。
技術領域
本發明涉及利用水印去除領域,特別是涉及一種去除特定字符串水印的方法和系統。
背景技術
目前,電商網站平臺上賣家商品展示的方式主要是以圖片和文字展示為主,其中圖片展示較為直觀全面,深得買家的認可。因此,圖片展示成為商品展示的主打展示方式之一。
對于電商平臺而言,需要通過搜索引擎優化來獲取更多流量,因此需要滿足搜索引擎規范要求,部分搜索引擎禁止在圖片中添加聯系方式等水印,因此電商平臺原先大量的帶水印的圖片需去除聯系方式等水印,其他水印則可以保留,因此大量的水印圖片無法通過模板方式去除,也無法要求客戶自己去除特定字符串水印,同時不同時段的需要去除的字符串規則各不相同,這給電商網站平臺圖片處理帶來了極大的挑戰。
如對比文件CN202010278085-PDF所示的一種PDF圖紙文字識別方法、系統以及設備,采用多種文字檢測方法CTPN、Seglink、Textboxes等,其目的都是在PDF中檢測出文字區域,采用CNN、CRNN方法識別文字,但傳統去水印方法是基于模板的方法,往往針對使用同一模板生成的水印,去除過程也針對于該模板統一去除,往往整張圖片所有水印都去除或另一未知模板生成的水印無法去除,無法做到特定字符串去除和不同模板統一去除,魯棒性差,而本案采用優化的OCR模型,可以識別不同模板生成的不同水印字符串,同時通過正則匹配,可以選定特定的字符串,不會造成圖片中所有字符的出去,魯棒性更強,準確率更高。
此外,對于原始CRNN模型,采用的主干網絡為類似VGG的神經網絡,同時字符圖片要求高度為32,但實際中,VGG網絡特征抽取效果不夠顯著,同時由于字符圖片高度設定為32像素,整體分辨率較低,抽取出的字符信息缺失較多,對后續解碼影響較大。
發明內容
本發明所要解決的技術問題是克服現有技術的不足,提供一種去除特定字符串水印的方法和系統。
為解決上述技術問題,本發明提供一種去除特定字符串水印的方法,其特征在于,將待處理圖片輸入到文字檢測模型,檢測是否存在字符串水印,若存在字符串水印,則將字符串所在圖片區域截取輸入文字識別模型中得到相應字符串,利用正則匹配是否存在特定字符串,若存在特定字符串,則將字符串所在圖片區域截取輸入生成網絡中,將該區域字符串去除,包括如下步驟:
步驟一:將待處理圖片輸入文字檢測模型,檢測是否存在字符串,若存在字符串,則返回字符串在圖片中位置坐標,若不存在字符串,則返回空;
步驟二:若待處理圖片含有字符串,則根據步驟一中字符串坐標,在待處理圖片中截取相應字符串圖片,將字符串圖片輸入文字識別模型,得到相應字符串;
步驟三:設定相應正則表達式,例如匹配手機號碼、匹配郵箱等正則,對步驟二中識別的字符串進行匹配,若匹配成功,則返回字符串所在圖片坐標;
步驟四:利用步驟三中匹配成功字符串的坐標,在待處理圖片中截取相應圖片,輸入去水印生成網絡,得到去除特定字符串水印的截圖,將去除水印的截圖還原到原待處理圖片中,得到完整的去除特定字符串水印的圖片。
所述步驟一中,采用CRAFT文字檢測模型對圖片中字符串進行檢測,若待處理圖片存在字符串,則返回字符串所在圖片中的坐標;所述CRAFT文字檢測模型檢測單個字符串及字符串間的連接關系,根據字符串間的連接關系確定文本行。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于焦點科技股份有限公司,未經焦點科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010943900.5/2.html,轉載請聲明來源鉆瓜專利網。





