[發(fā)明專利]一種文本處理方法及相關裝置有效
| 申請?zhí)枺?/td> | 202110738496.2 | 申請日: | 2021-06-30 |
| 公開(公告)號: | CN113627242B | 公開(公告)日: | 2022-09-27 |
| 發(fā)明(設計)人: | 李明;付彬;喬宇 | 申請(專利權)人: | 中國科學院深圳先進技術研究院 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06V10/774;G06V30/40 |
| 代理公司: | 廣州三環(huán)專利商標代理有限公司 44202 | 代理人: | 熊永強;陳聰 |
| 地址: | 518055 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 文本 處理 方法 相關 裝置 | ||
1.一種文本處理方法,其特征在于,包括:
獲取第一文本圖片;所述第一文本圖片為包括第一文本的圖片;
將所述第一文本圖片輸入至文本矯正網絡進行文本矯正,得到包括第二文本的第二文本圖片;所述文本矯正網絡為利用所述第一文本中的每個字符的位置信息進行矯正的網絡,所述第二文本的文本內容與所述第一文本的文本內容相同,所述第二文本圖片中的所述第二文本為水平文本;
所述將所述第一文本圖片輸入至文本矯正網絡進行文本矯正,得到包括第二文本的第二文本圖片的步驟,包括:
獲取所述第一文本中的字符的各個不同層級的掩碼;所述各個不同層級的掩碼大小不同,所述各個不同層級的掩碼用于表征所述字符的位置信息;
根據所述字符的位置信息構建所述字符的坐標框;所述坐標框用于確定所述字符的控制點;
根據所述控制點對所述字符進行矯正,得到包括所述第二文本的所述第二文本圖片。
2.根據權利要求1所述的方法,其特征在于,所述根據所述字符的位置信息構建所述字符的坐標框之前,所述方法還包括:
查找所述各個不同層級的掩碼對應的連通域,得到目標連通域;所述目標連通域用于優(yōu)化所述字符的位置信息。
3.根據權利要求2所述的方法,其特征在于,所述查找所述各個不同層級的掩碼對應的連通域,得到目標連通域,包括:
查找第一掩碼對應的連通域,得到第一連通域;以及,查找第二掩碼對應的連通域,得到第二連通域;所述第二連通域不與所述第一連通域重合,所述第二掩碼大于所述第一掩碼;
將所述第一連通域和所述第二連通域作為所述目標連通域。
4.根據權利要求1至3中任一項所述的方法,其特征在于,所述獲取所述第一文本中的字符的各個不同層級的掩碼,包括:
根據損失函數獲取所述第一文本中的字符的各個不同層級的掩碼,所述損失函數用于表征所述字符的掩碼和所述字符的位置信息的準確率。
5.根據權利要求1至3中任一項所述的方法,其特征在于,所述方法還包括:
將所述第二文本圖片輸入至文本識別網絡進行識別,得到所述第二文本。
6.一種文本處理裝置,其特征在于,包括:
獲取單元,用于獲取第一文本圖片;所述第一文本圖片為包括第一文本的圖片;
矯正單元,用于將所述第一文本圖片輸入至文本矯正網絡進行文本矯正,得到包括第二文本的第二文本圖片;所述文本矯正網絡為利用所述第一文本中的每個字符的位置信息進行矯正的網絡,所述第二文本的文本內容與所述第一文本的文本內容相同,所述第二文本圖片中的所述第二文本為水平文本;
所述矯正單元,用于將所述第一文本圖片輸入至文本矯正網絡進行文本矯正,得到包括第二文本的第二文本圖片,包括:
所述獲取單元,還用于獲取所述第一文本中的字符的各個不同層級的掩碼;所述各個不同層級的掩碼大小不同,所述各個不同層級的掩碼用于表征所述字符的位置信息;
構建單元,用于根據所述字符的位置信息構建所述字符的坐標框;所述坐標框用于確定所述字符的控制點;
采樣單元,用于根據所述坐標框對所述字符的控制點采樣;
所述矯正單元,具體用于根據所述控制點對所述字符進行矯正,得到包括所述第二文本的所述第二文本圖片。
7.一種文本處理裝置,其特征在于,包括:處理器和存儲器;
所述存儲器用于存儲計算機執(zhí)行指令;
所述處理器用于執(zhí)行所述存儲器所存儲的計算機執(zhí)行指令,以使所述文本處理裝置執(zhí)行如權利要求1至5中任一項所述的方法。
8.一種計算機可讀存儲介質,其特征在于,包括:
所述計算機可讀存儲介質用于存儲指令或計算機程序;當所述指令或所述計算機程序被執(zhí)行時,使如權利要求1至5中任一項所述的方法被實現。
9.一種計算機程序產品,其特征在于,包括:指令或計算機程序;
所述指令或所述計算機程序被執(zhí)行時,使如權利要求1至5中任一項所述的方法被實現。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院深圳先進技術研究院,未經中國科學院深圳先進技術研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110738496.2/1.html,轉載請聲明來源鉆瓜專利網。





