[發明專利]文本圖像矯正方法、裝置、計算機設備及存儲介質在審
| 申請號: | 201911117254.0 | 申請日: | 2019-11-15 |
| 公開(公告)號: | CN110866871A | 公開(公告)日: | 2020-03-06 |
| 發明(設計)人: | 王鑫;溫凱雯;呂仲琪;顧正 | 申請(專利權)人: | 深圳市華云中盛科技股份有限公司 |
| 主分類號: | G06T3/60 | 分類號: | G06T3/60;G06T7/13;G06T7/181 |
| 代理公司: | 深圳市精英專利事務所 44242 | 代理人: | 劉萍 |
| 地址: | 518000 廣東省深圳市南山區粵海街道麻嶺*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文本 圖像 矯正 方法 裝置 計算機 設備 存儲 介質 | ||
本發明涉及文本圖像矯正方法、裝置、計算機設備及存儲介質,該方法包括獲取需要矯正的文本圖像;將需要矯正的文本圖像輸入至邊緣檢測模型進行深度學習,以得到二值邊緣圖像;其中,邊緣檢測模型是通過若干帶有邊緣信息的文本圖像對深度學習網絡進行訓練所得的;對二值邊緣圖像進行文本精細定位,以得到文本邊界框及文本邊界框的頂點坐標;根據文本邊界框的頂點坐標計算透視變換矩陣;根據透視變換矩陣對文本邊界框內的圖像及文本邊界框的頂點坐標進行透視變換,以得到矯正后的文本圖像;將矯正后的文本圖像發送至終端,以供終端查閱和調用。本發明實現不同場景下的文檔邊緣提取精度,減少非文檔區域噪聲邊緣的干擾,并細化文檔坐標位置。
技術領域
本發明涉及圖像處理方法,更具體地說是指文本圖像矯正方法、裝置、計算機設備及存儲介質。
背景技術
文檔數字化對于實現文檔內容智能分析處理和珍貴文獻材料保存具有重要作用,是數字化政務建設的基礎手段。傳統的文檔數字化操作主要利用專門的掃描儀掃描,其通常存在不易攜帶,成本較高等缺點。近年來,隨著智能手機的不斷普及,越來越多的人開始使用手機攝像頭掃描生活中常見的文檔如書籍、票據等,然后通過光學字符識別技術和自然語言處理技術自動完成文檔的數字化掃描和分析。然而,當使用便捷式攝像頭拍攝文本圖像時,由于拍攝場景的多樣性和復雜性,容易出現扭曲、彎曲、褶皺或者含有復雜的背景等問題,這些問題通常會嚴重影響光學字符識別技術的準確度。因此,良好的文檔圖像矯正技術是OCR的一項重要的預處理技術。
當前,文本圖像矯正的技術框架主要由文檔邊緣定位和透視矯正兩部分構成。傳統的技術手段主要是使用傳統的Canny邊緣檢測算子提取圖像的邊緣信息,并設計一系列規則判定算法以獲取符合文檔圖像特性的邊界框,由于Canny算法得到的邊緣信息存在各種問題,包括長短不一的邊緣線段和復雜的背景邊緣噪聲等,現有方法主要是不斷調整canny算子的檢測閾值以適應不同場景下的文檔圖像,但基于人工經驗的參數調整方法會存在魯棒性較弱的問題,不同場景可能需要設置不同的參數,隨著深度學習在目標檢測、分割等視覺領域取得的較大進展,基于YOLO的目標檢測算法被廣泛應用于實際場景,然而,YOLO算法的輸出通常是一個表示目標位置區域的非旋轉矩形框,無法對含有角度的文檔區域定位。
因此,有必要設計一種新的方法,實現不同場景下的文檔邊緣提取精度,減少非文檔區域噪聲邊緣的干擾,并細化文檔坐標位置。
發明內容
本發明的目的在于克服現有技術的缺陷,提供文本圖像矯正方法、裝置、計算機設備及存儲介質。
為實現上述目的,本發明采用以下技術方案:文本圖像矯正方法,包括:
獲取需要矯正的文本圖像;
將需要矯正的文本圖像輸入至邊緣檢測模型進行深度學習,以得到二值邊緣圖像;其中,所述邊緣檢測模型是通過若干帶有邊緣信息的文本圖像對深度學習網絡進行訓練所得的;
對所述二值邊緣圖像進行文本精細定位,以得到文本邊界框及文本邊界框的頂點坐標;
根據所述文本邊界框的頂點坐標計算透視變換矩陣;
根據透視變換矩陣對所述文本邊界框內的圖像及文本邊界框的頂點坐標進行透視變換,以得到矯正后的文本圖像;
將矯正后的文本圖像發送至終端,以供終端查閱和調用。
其進一步技術方案為:所述邊緣檢測模型是通過若干帶有邊緣信息的文本圖像對深度學習網絡進行訓練所得的,包括:
構建深度學習網絡及損失函數,其中,所述深度學習網絡包括順次連接的第一層網絡、第二層網絡、第三層網絡、第四層網絡以及三層空洞卷積層,第一層網絡、第二層網絡、第三層網絡以及第四層網絡的參數分別與VGG16網絡對應層參數一致;
獲取若干帶有邊緣信息的文本圖像,以得到樣本集;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳市華云中盛科技股份有限公司,未經深圳市華云中盛科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911117254.0/2.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





