[發(fā)明專利]圖像文檔校正方法、系統(tǒng)、終端及介質在審
| 申請?zhí)枺?/td> | 202110901444.2 | 申請日: | 2021-08-06 |
| 公開(公告)號: | CN113808033A | 公開(公告)日: | 2021-12-17 |
| 發(fā)明(設計)人: | 韋建;周異;陳凱;黃征;周曲 | 申請(專利權)人: | 上海深杳智能科技有限公司;廈門商集網絡科技有限責任公司 |
| 主分類號: | G06T5/00 | 分類號: | G06T5/00;G06K9/46;G06N3/04;G06N3/08 |
| 代理公司: | 上海恒慧知識產權代理事務所(特殊普通合伙) 31317 | 代理人: | 劉翠 |
| 地址: | 200240 上海市*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 圖像 文檔 校正 方法 系統(tǒng) 終端 介質 | ||
本發(fā)明提供了一種圖像文檔校正方法及系統(tǒng),包括:基于原始圖像預設多個位置參考點;構建圖像特征提取模型,將原始圖像輸入至圖像特征提取模型提取圖像特征;構建基于透視變換的圖像校正模型,將圖像特征輸入至圖像校正模型,預測得到每一個位置參考點在校正后圖像上的相對位置坐標變化;根據位置參考點在原始圖像中的位置和位置參考點在校正后圖像上的位置的相對位置坐標變化,計算形變校正矩陣,并將形變校正矩陣作用到原始圖像,對原始圖像進行校正。同時提供了一種相應的終端及介質。本發(fā)明針對各種復雜情況下的圖像形變問題,不需要檢測保持固定位置關系的多個錨點,不依賴圖像前背景檢測結果,能對任意拍照不完整的圖像文檔進行形變校正。
技術領域
本發(fā)明涉及圖像處理技術領域,具體地,涉及一種圖像文檔校正方法、系統(tǒng)、終端及介質。
背景技術
傳統(tǒng)圖像處理方法一般使用通過掃描儀得到的圖像,圖像質量清晰,形變小。近幾年來,隨著手機端應用和智能駕駛的廣泛使用,基于拍照圖片的應用越來越多,比如文字定位與識別、文檔理解等應用。拍照使用雖然很方便,但是基于手機或者攝像頭拍照的圖像容易受到拍攝角度,拍攝距離以及攝像頭的參數影響,基本都存在圖像形變,并且大部分拍照圖像形變較大,從而導致應用的準確率下降較大。
目前常用的圖像形變校正方法,基于透視變換原理,通過線檢測,目標邊緣檢測等方法獲取已知固定位置關系的4個錨點,然后通過計算檢測到的4點與固定位置關系的四點間的映射關系獲取形變矩陣,將形變圖像校正為正常無形變圖像,如圖1所示。
也就是說,目前常用的圖像形變校正方法,通常基于檢測到4個保持矩形關系的錨點,但是在實際應用中,由于拍照不全導致圖像文檔被截斷、前背景相近以及目標本身的復雜性等情況,很難檢測有效的4個錨點,如圖2所示,導致形變校正的性能很差。
經過檢索發(fā)現(xiàn):
公開號為CN111860489A的中國發(fā)明專利申請《一種證件圖像校正方法、裝置、設備及存儲介質》,采用預設校正模型,獲取待識別圖像中的證件角點的待校正角點坐標,所述預設校正模型由樣本集合訓練獲取,所述樣本集合包括多個樣本證件圖像,每個所述樣本證件圖像標注有角點坐標;根據校正后證件的各目標角點坐標和對應的所述待校正證件角點坐標,計算獲取變換矩陣;根據所述變換矩陣對所述待識別圖像中的證件進行透視變換,得到校正后的證件圖像,解決現(xiàn)有技術中校正方法受圖像背景圖案影響較大,若圖像中存在其他邊緣線信息,會干擾證件的邊緣線檢測的問題,達到提高校正效果的作用。該專利技術面向證件圖像,通過訓練模型預測證件的四個角點在校正后的位置,是基于具體的圖像錨點來實現(xiàn)校正的功能,存在較大的局限性,無法適用于通用的文檔校正場景。
公開號為CN110674815A的中國發(fā)明專利申請《基于深度學習關鍵點檢測的發(fā)票圖像畸變校正方法》,首先,訓練數據標注及增強;其次,設置網絡結構及訓練參數;然后,利用網絡結構及訓練參數設置訓練關鍵點檢測模型,保存訓練后的模型;再然后,利用訓練后的模型進行票據關鍵點檢測;最后,利用檢測到的關鍵點進行票據對齊。本發(fā)明可以快速、精確、適用于自然場景,對校正后的圖片進行識別很大程度上提高了OCR識別的準確率,為下游OCR應用減少人力物力投入,節(jié)省資源。該方法面向發(fā)票圖像,通過訓練模型預測發(fā)票上的關鍵點,然后通過檢測到的關鍵點和標準發(fā)票的關鍵點的位置,計算相應的透視變換矩陣,其中關鍵點的定義是指圖像上一些有固定特征的點,比如表格的角點、固定文字區(qū)域的位置。該方法也是基于具體的圖像錨點來實現(xiàn)校正的功能,存在較大的局限性,無法適用于通用的文檔校正場景。
發(fā)明內容
本發(fā)明針對現(xiàn)有技術中存在的上述不足,提供了一種圖像文檔校正方法、系統(tǒng)、終端及介質。
根據本發(fā)明的一個方面,提供了一種圖像文檔校正方法,包括:
基于原始圖像預設多個位置參考點;
構建圖像特征提取模型,將所述原始圖像輸入至所述圖像特征提取模型提取圖像特征;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海深杳智能科技有限公司;廈門商集網絡科技有限責任公司,未經上海深杳智能科技有限公司;廈門商集網絡科技有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110901444.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:電子產品用制程保護貼膜
- 下一篇:一種低吞吐量DNS隱蔽信道檢測方法及裝置
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





