[發明專利]一種拍屏文件圖片檢測方法、裝置及存儲介質有效
| 申請號: | 202010761222.0 | 申請日: | 2020-07-31 |
| 公開(公告)號: | CN111985483B | 公開(公告)日: | 2022-08-26 |
| 發明(設計)人: | 黃仁裕;吳堅;高志鵬;趙建強;張輝極;黃劍;杜新勝;尤俊生 | 申請(專利權)人: | 廈門市美亞柏科信息股份有限公司 |
| 主分類號: | G06V10/764 | 分類號: | G06V10/764;G06V10/26;G06V30/24;G06V10/82;G06N3/04;G06N3/08 |
| 代理公司: | 廈門福貝知識產權代理事務所(普通合伙) 35235 | 代理人: | 陳遠洋 |
| 地址: | 361000 福建省廈門市思明*** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 文件 圖片 檢測 方法 裝置 存儲 介質 | ||
本發明提出了一種拍屏文件圖片檢測方法、裝置及存儲介質,該方法包括:拍照設備中獲取待檢測的圖片;使用第一卷積神經網絡模型對所述待檢測的圖片進行檢測,如果該圖片為拍屏圖片,則使用第二卷積神經網絡檢測該圖片中是否包含文字,如果是,則進行文字識別;使用第三卷積神經網絡模型對包含文字的拍屏圖片進行文字識別,得到文本文件;使用所述文本文件與計算機系統中存儲的文件進行匹配,如果匹配度大于第一閾值,則發出警報。本發明考慮到硬件的限制,設計了速度較快且準確率較好的圖片分類模型,改進基于卷積神經網絡的文字檢測和文本識別算法,提升了文字檢測和文本識別的速度,解決了拍屏文件圖片檢測和文本識別問題,可應用于低端手持設備,提升了用戶體驗。
技術領域
本發明涉及文本數據處理技術領域,具體涉及一種拍屏文件圖片檢測方法、裝置及存儲介質。
背景技術
近年來,隨著帶攝像頭的移動終端設備在人們生活中的日益普及,平板電腦、智能手機在大大方便人們生活、工作的同時,也存在著敏感信息泄露的安全隱患。越來越多的企事業單位、政府部門,逐步推行無紙化辦公,在低碳環保的理念下,傳統的紙質資料,正不斷被數字化資料所取代。絕大部分高密級文檔或者尚未發布的文檔都會優先使用電子文檔編輯,只有保密期結束的保密文檔和可對外發布的文檔才能公開。人們在享受數字化、高效化辦公帶來巨大便利性,同時也在防范電子網絡的安全保密。在安全密級較高的企事業或政府部門,自行組建內部網絡,禁止使用usb口等措施防止敏感電子文件通過網絡方式泄密,但是無法阻止使用拍照設備拍攝的泄密方式。為了防止電子文件被人為用拍照設備進行拍攝導致泄密,高密級單位部門會不定期檢查這些設備,特別是隨身攜帶且可聯互聯網的手機,但單靠人工檢查這些設備里的圖像,存在費時、費力的缺點。
拍攝顯示屏的圖片主要特點是圖片會呈現波紋,主要有兩個原因,一為顯示屏和拍照拍攝快門頻率不同,二為莫爾條紋的干擾。由于拍照設備拍攝顯示屏時圖片的產生波紋種類有多種,包含橫向、縱向或者有弧度的波紋,這些波紋相當于在正常圖片中添加了高頻噪聲,可以通過傅里葉變換后在頻域上分析白色像素線進行分離,但隨著拍照設備攝像頭像素越來越高,拍照設備距離顯示屏較遠處就可以拍出較清晰的圖片,拍照設備離顯示屏越遠,拍攝的圖片中的波紋越不明顯,同時人為調整拍攝設備和顯示屏的角度,也可以降低波紋的明顯程度,導致傳統的使用傅里葉變換的頻譜圖進行區分是否為拍屏圖像成為一個難題。
現有技術中,如何快速準確的檢測出圖像中的文本,進而進行基于光學字符的識別(OCR),一直是相關領域學者的研究熱點,圖像文本的檢測技術主要有傳統的數字圖像處理方法和基于深度學習方法。傳統的數字圖像處理方法總體上速度較快,但準確率還需提高,深度學習方法準確率高,但速度較慢。
現有技術中,還有些使用一個復雜的神經網絡完成所有工作,但是,有些圖片根本就不是拍屏圖片,所以浪費了系統的存儲空間及計算能力,即現有的網絡模型不適合拍屏文件圖片的檢測,影響了用戶體驗。
發明內容
本發明針對上述現有技術中一個或多個技術缺陷,提出了如下技術方案。
一種拍屏文件圖片檢測方法,該方法包括:
獲取步驟,從拍照設備中獲取待檢測的圖片;
檢測步驟,使用第一卷積神經網絡模型對所述待檢測的圖片進行檢測,如果該圖片為拍屏圖片,則使用第二卷積神經網絡檢測該圖片中是否包含文字,如果是,則進行文字識別;
識別步驟,使用第三卷積神經網絡模型對包含文字的拍屏圖片進行文字識別,得到文本文件;
匹配步驟,使用所述文本文件與計算機系統中存儲的文件進行匹配,如果匹配度大于第一閾值,則發出警報。
更進一步地,所述計算機系統中存儲的文件為涉密文件,所述第一卷積神經網絡模型和第二卷積神經網絡的卷積層數少于所述第三卷積神經網絡模型的卷積層數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廈門市美亞柏科信息股份有限公司,未經廈門市美亞柏科信息股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010761222.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:消息發送方法、裝置和電子設備
- 下一篇:繞過自簽證書校驗的方法和裝置





