[發(fā)明專利]文本圖像的校正方法、設備及計算機可讀存儲介質(zhì)有效
| 申請?zhí)枺?/td> | 201911030274.4 | 申請日: | 2019-10-28 |
| 公開(公告)號: | CN112733837B | 公開(公告)日: | 2022-08-02 |
| 發(fā)明(設計)人: | 項宇澤;高佳妮;何小坤 | 申請(專利權(quán))人: | 北京易真學思教育科技有限公司 |
| 主分類號: | G06V30/146 | 分類號: | G06V30/146;G06V20/62;G06V30/162 |
| 代理公司: | 北京合智同創(chuàng)知識產(chǎn)權(quán)代理有限公司 11545 | 代理人: | 李杰 |
| 地址: | 100041 北京市石景山區(qū)*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 文本 圖像 校正 方法 設備 計算機 可讀 存儲 介質(zhì) | ||
本申請實施例提供一種文本圖像的校正方法、設備及計算機可讀存儲介質(zhì),該文本圖像的校正方法包括:對目標圖像進行檢測,并確定至少兩個文本塊;在至少兩個文本塊中確定互為鄰近文本塊的至少一對文本塊,并將至少一對文本塊中每一對文本塊進行合并確定出至少一個文本行;對至少一個文本行進行校正。因為利用互為鄰近文本塊的雙向匹配關(guān)系確定了文本行,在對文本行進行扭曲校正時更加準確。
技術(shù)領域
本申請實施例涉及圖像處理領域,尤其涉及一種文本圖像的校正方法、設備及計算機可讀存儲介質(zhì)。
背景技術(shù)
隨著科技的發(fā)展,識別圖像中的文本內(nèi)容在生活工作中的應用日益廣泛,例如,在線教學的應用場景中,學生上傳手寫的作業(yè)圖片或者考卷,計算機自動批改時,就需要對圖像中的文本內(nèi)容進行識別;又如,對證書/證件進行自動驗證的場景中,也需要對證書/證件的圖像中的文本內(nèi)容進行識別。在對圖像中的文本內(nèi)容進行識別的過程中,由于圖像可能是拍攝的照片、或者手寫的文本,如果拍攝的文本對象沒有正對鏡頭,有可能導致圖像中的文本是歪斜的,如果拍攝的文本對象彎曲,比如書頁靠近裝訂側(cè)的部分容易彎曲,有可能導致圖像中的文本是扭曲的,因為圖像中的文本歪斜或者扭曲,導致對圖像中的文本進行識別的準確度較低。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明實施例所解決的技術(shù)問題之一在于提供一種文本圖像的校正方法、設備及計算機可讀存儲介質(zhì),用以克服上述問題。
第一方面,本申請實施例提供了一種文本圖像的校正方法,其包括:
對目標圖像進行檢測,并確定至少兩個文本塊;在至少兩個文本塊中確定互為鄰近文本塊的至少一對文本塊,并將至少一對文本塊中每一對文本塊進行合并確定出至少一個文本行;對至少一個文本行進行校正。
可選地,在本申請的一個實施例中,該方法還包括:
在第一文本塊中心點及第二文本塊中心點的連線與第一文本塊橫底邊的夾角小于或等于預設夾角時,將第二文本塊確定為第一文本塊的候選文本塊;
在第一文本塊的候選文本塊中確定第一文本塊的鄰近文本塊。
可選地,在本申請的一個實施例中,在第一文本塊的候選文本塊中確定第一文本塊的鄰近文本塊,包括:
在第一文本塊的候選文本塊中,將與第一文本塊橫向距離最近的文本塊確定為第一文本塊的鄰近文本塊。
可選地,在本申請的一個實施例中,在至少兩個文本塊中確定互為鄰近文本塊的至少一對文本塊,包括:
在第二文本塊是第一文本塊左側(cè)的鄰近文本塊,且第一文本塊是第二文本塊右側(cè)的鄰近文本塊時,確定第一文本塊和第二文本塊互為鄰近文本塊;
和/或,在第二文本塊是第一文本塊右側(cè)的鄰近文本塊,且第一文本塊是第二文本塊左側(cè)的鄰近文本塊時,確定第一文本塊和第二文本塊互為鄰近文本塊。
可選地,在本申請的一個實施例中,對至少一個文本行進行校正,包括:
根據(jù)變形矩陣計算目標文本行中每一個像素點校正后的坐標。
可選地,在本申請的一個實施例中,該方法還包括:
在目標文本行中確定至少一個控制點的坐標集合;
根據(jù)目標文本行至少一個控制點的坐標集合得到變形矩陣。
可選地,在本申請的一個實施例中,根據(jù)目標文本行至少一個控制點的坐標集合得到變形矩陣,包括:
根據(jù)至少一個控制點變形前的坐標以及至少一個控制點變形后的坐標計算變形矩陣。
可選地,在本申請的一個實施例中,該方法還包括:
計算至少兩個文本塊的傾斜角度的平均值,將傾斜角度平均值作為文本區(qū)域的傾斜角度;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京易真學思教育科技有限公司,未經(jīng)北京易真學思教育科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911030274.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





