[發明專利]一種畸形文本矯正方法、系統及文字識別方法在審
| 申請號: | 202010811570.4 | 申請日: | 2020-08-13 |
| 公開(公告)號: | CN111967469A | 公開(公告)日: | 2020-11-20 |
| 發明(設計)人: | 安達 | 申請(專利權)人: | 上海明略人工智能(集團)有限公司 |
| 主分類號: | G06K9/32 | 分類號: | G06K9/32;G06K9/34 |
| 代理公司: | 青島清泰聯信知識產權代理有限公司 37256 | 代理人: | 李祺 |
| 地址: | 200030 上海市徐*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 畸形 文本 矯正 方法 系統 文字 識別 | ||
本發明提出一種畸形文本矯正方法、系統及文字識別方法,所述矯正方法包括:文檔圖像獲取步驟,用于獲取目標文檔圖像;模型生成步驟,用于基于所述文檔圖像的像素分布生成一高斯熱力圖,所述高斯熱力圖為所述文檔圖像的像素概率模型,通過高斯熱力圖可視化地反映像素出現概率;文字分割步驟,用于通過邊緣檢測獲取所述高斯熱力圖的文字邊界,并根據所述文字邊界對所述文檔圖像的文字進行分割,得到所述文檔圖像的文字對應的多個文字區域圖像;文本矯正步驟,用于利用奇異值分解對每一所述文字區域圖像進行矩陣變換得到矯正后的文字區域圖像,進而得到矯正后的文檔圖像,本方案實現對任意形狀排布的畸形文字有較好的矯正效果,且計算量小。
技術領域
本發明屬于圖像處理技術領域,尤其涉及一種畸形文本矯正方法、系統及文字識別方法。
背景技術
對于扭曲的文字行,比如環形標志中的文字、彎曲的文檔、彎曲的證件等等,例如圖1中所示的畸形文字。當前畸形文本矯正主要用了霍夫變換或者深度學習的方法。霍夫變換對特定曲線的文字識別效果比較好,但是對于不規則形狀很難識別。深度學習的方法需要大量樣本進行訓練,當樣本數量不足時,同樣影響其矯正效果。
發明內容
為解決上述的技術問題,本發明提出一種畸形文本矯正方法、系統及文字識別方法,實現對任意形狀排布的畸形文字有較好的矯正效果,且計算復雜度低、計算量小。
一方面,本發明公開了一種畸形文本矯正方法,包括:
文檔圖像獲取步驟,用于獲取待操作的目標文檔圖像;
模型生成步驟,用于基于所述文檔圖像的像素分布生成一高斯熱力圖,所述高斯熱力圖為所述文檔圖像的像素概率模型,通過高斯熱力圖可視化地反映像素出現概率;
文字分割步驟,用于通過邊緣檢測獲取所述高斯熱力圖的文字邊界,并根據所述文字邊界對所述文檔圖像的文字進行分割,得到所述文檔圖像的文字對應的多個文字區域圖像;
文本矯正步驟,用于利用奇異值分解對每一所述文字區域圖像進行矩陣變換得到矯正后的文字區域圖像,進而得到矯正后的文檔圖像。
進一步,所述文本矯正步驟進一步包括:
通過計算得到每一文字區域圖像的協方差矩陣,表示為Q;
對所述協方差矩陣Q進行奇異值分解,得到所述協方差矩陣的奇異向量,所述奇異向量表示為U;
利用所述奇異向量U對文字區域圖像進行矩陣變換,得到矯正后的文字區域圖像。
進一步,所述文字分割步驟還包括:
文字區域圖像標引步驟,用于通過一位置索引記錄每一所述文字區域圖像的相對位置關系,所述相對位置關系可以是多個所述文字區域圖像之間的位置關系,也可以是每一所述文字區域圖像與所述文檔圖像之間的位置關系。
進一步,所述文本矯正步驟還包括:
文檔圖像還原步驟,用于根據所述位置索引組合拼接多個所述文字區域圖像,得到矯正后的文檔圖像。
進一步,所述協方差矩陣Q表示為:
其中,Cov(X,Y)為X與Y協方差,Var(X)為X的方差,Var(Y)為Y的方差。
進一步,采用二維正態分布表示所述文字區域圖像,圖像中每個黑色像素點坐標為(xi,yi),X為像素橫坐標xi的集合,Y為像素縱坐標yi的集合。
進一步,所述矯正后的文字區域圖像表示為:
I'=I*U-1,
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海明略人工智能(集團)有限公司,未經上海明略人工智能(集團)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010811570.4/2.html,轉載請聲明來源鉆瓜專利網。





