[發明專利]一種文本矯正的方法、裝置、電子設備和存儲介質有效
| 申請號: | 202010517203.3 | 申請日: | 2020-06-09 |
| 公開(公告)號: | CN111695554B | 公開(公告)日: | 2023-02-21 |
| 發明(設計)人: | 韋文杰;許多;鄧小兵 | 申請(專利權)人: | 廣東小天才科技有限公司 |
| 主分類號: | G06V30/14 | 分類號: | G06V30/14;G06V30/146;G06V30/148;G06V10/82;G06T5/00;G06N3/04;G06N3/08 |
| 代理公司: | 廣州智斧知識產權代理事務所(普通合伙) 44649 | 代理人: | 孔德超 |
| 地址: | 528850 廣東省東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 文本 矯正 方法 裝置 電子設備 存儲 介質 | ||
本發明實施例涉及圖像處理技術領域,公開了一種文本矯正的方法、裝置、電子設備和存儲介質。該方法包括:獲取目標文本圖像;將所述目標文本圖像輸入基于深度學習的文本行檢測網絡模型,得到所述目標文本圖像對應的掩碼圖;利用所述掩碼圖確定文本行輪廓及每個文本行輪廓對應的文本中線;利用所述掩碼圖設置對應目標文本圖像的第一控制點;根據所述第一控制點設置第二控制點;將所述目標文本圖像、以及第一控制點和第二控制點輸入圖像矯正網絡,得到矯正圖像。實施本發明實施例,使用文本行檢測算法和圖像矯正網絡相結合,對檢測出的文本行進行插值,進而根據結果進行扭曲矯正。
技術領域
本發明涉及圖像處理技術領域,具體涉及一種文本矯正的方法、裝置、電子設備和存儲介質。
背景技術
當前存在扭曲文字矯正算法大多是基于傳統方法,使用角點檢測、連通域檢測、霍夫變換等進行矯正,有些還需要進行相機標定等。傳統方法受環魯棒性較差,對顏色、紋理、動態模糊等影響較為敏感,當拍攝得到的文本行情況復雜時,矯正效果往往不理想。目前并沒有非常成熟的針對拍攝圖片的場景下的扭曲文本行的矯正算法。
發明內容
針對所述缺陷,本發明實施例公開了一種文本矯正的方法、裝置、電子設備和存儲介質,其可以很好地檢測出扭曲文本,因此對各種復雜情況有較好的魯棒性。
本發明實施例第一方面公開一種文本矯正的方法,所述方法包括:
獲取目標文本圖像;
將所述目標文本圖像輸入基于深度學習的文本行檢測網絡模型,得到所述目標文本圖像對應的掩碼圖;利用所述掩碼圖確定文本行輪廓及每個文本行輪廓對應的文本中線;
利用所述掩碼圖設置對應目標文本圖像的第一控制點,所述第一控制點包括文本采樣點和邊框采樣點,所述第二控制點包括第一源點集合和第二源點集合;在所述文本中線上選取多個文本采樣點,構建每個文本中線的文本采樣點集合;在所述掩碼圖中距離掩碼圖邊緣最近距離為預設距離的位置設置多個邊框采樣點,形成邊框采樣點集合;
根據所述第一控制點設置第二控制點;所述第二控制點包括第一源點集合和第二源點集合,所述第一源點集合包括多個文本源點子集合,且所述文本源點子集合和文本采樣點集合一一對應,每個文本源點子集合中文本源點的個數與對應文本采樣點集合中的文本采樣點的個數相同,所述第二源點集合中源點個數與所述邊框采樣點集合中的邊框采樣點的個數相同;
將所述目標文本圖像、以及第一控制點和第二控制點輸入圖像矯正網絡,得到矯正圖像。
作為一種可選的實施方式,在本發明實施例第一方面中,將所述目標文本圖像輸入基于深度學習的文本行檢測網絡模型,得到所述目標文本圖像對應的掩碼圖;利用所述掩碼圖確定文本行輪廓及每個文本行輪廓對應的文本中線,包括:
將所述目標文本圖像輸入預先訓練的基于深度學習的文本行檢測網絡模型,輸出所述目標文本圖像對應的掩碼圖;所述掩碼圖與所述目標文本圖像的尺寸相同,且所述掩碼圖中包括多個文本區域掩碼;
利用所述文本區域掩碼得到對應的文本行輪廓;
利用輪廓收縮的方式確定每個文本行輪廓對應的文本中線。
作為一種可選的實施方式,在本發明實施例第一方面中,在所述文本中線上選取多個文本采樣點,構建每個文本中線的文本采樣點集合,包括:
在所述文本中線上選取多個像素點作為文本采樣點,同一文本中線任意兩個相鄰的文本采樣點之間間隔相同;
利用同一文本中線中所有文本采樣點構建文本采樣點集合,利用文本采樣點集合中所有文本采樣點的坐標構建文本采樣點矩陣。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣東小天才科技有限公司,未經廣東小天才科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010517203.3/2.html,轉載請聲明來源鉆瓜專利網。





