[發明專利]基于手寫字體識別的方法及識別系統在審
| 申請號: | 202310658892.3 | 申請日: | 2023-06-06 |
| 公開(公告)號: | CN116416628A | 公開(公告)日: | 2023-07-11 |
| 發明(設計)人: | 徐丹;白世亮 | 申請(專利權)人: | 廣州宏途數字科技有限公司 |
| 主分類號: | G06V30/19 | 分類號: | G06V30/19;G06V10/10;G06V10/32;G06V30/18;G06V10/764;G06V10/82;G06N3/0464;G06N3/08;G06T3/00 |
| 代理公司: | 廣州君咨知識產權代理有限公司 44437 | 代理人: | 李平 |
| 地址: | 510000 廣東省廣州市*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 手寫 字體 識別 方法 系統 | ||
1.一種基于手寫字體識別的方法,其特征在于,包括:
步驟S1,文字采集模塊采集不同的手寫字體圖像并輸送至數據準備模塊;
步驟S2,所述數據準備模塊將用以遷移風格的手寫字體圖像記為目標圖像,數據準備模塊選取字體庫圖像,將其記為風格圖像并將該風格圖像的風格作為目標圖像風格遷移后的風格標準;所述數據準備模塊將所述目標圖像和所述風格圖像輸送至數據預處理模塊;
步驟S3,所述數據預處理模塊對所述風格圖像進行裁切處理以使風格圖像的尺寸與所述目標圖像尺寸相同,數據預處理模塊在完成對風格圖像的裁切后依次制作針對風格圖像和目標圖像的掩碼圖并對各圖像進行顏色格式轉換處理;所述數據預處理模塊將各轉換后圖像和各所述掩碼圖輸送至模型訓練模塊;
步驟S4,所述模型訓練模塊在接收到各所述轉換后圖像和各所述掩碼圖時進行圖像遷移融合處理以得到最優參數模型并將最優參數模型輸送至批量生成數據模塊;
步驟S5,所述批量生成數據模塊在接收到所述最優參數模型后進行批量數據生成處理以生成風格遷移后的目標圖像數據,完成手寫字體識別。
2.根據權利要求1所述的基于手寫字體識別的方法,其特征在于,在所述步驟S3中,所述數據預處理模塊對所述風格圖像和所述目標圖像的預處理過程包括:
步驟S31,所述數據預處理模塊采用Opencv+Python程序對所述風格圖像進行隨機裁剪以使裁剪后的風格圖像的尺寸與所述目標圖像的尺寸相同;
步驟S32,所述數據預處理模塊采用labelme軟件對所述目標圖像中字體區域的圖像信息進行割離以完成對目標掩碼圖的制作,數據預處理模塊采集所述風格圖像中的風格特征并隔離風格圖像中的非風格特征以完成對風格掩碼圖的制作,數據預處理模塊用語義描述字體區域以使目標掩碼圖和風格掩碼圖在同一編碼的區域進行風格遷移;
步驟S33,所述數據預處理模塊依次將所述目標圖像和所述風格圖像的RGB顏色格式轉化成YUV顏色格式;所述數據預處理模塊在所述模型訓練模塊完成針對各所述掩碼圖和各所述轉換后圖像的模型訓練后將目標圖像的YUV顏色格式轉化為RGB顏色格式并以RGB顏色格式保存目標圖像。
3.根據權利要求2所述的基于手寫字體識別的方法,其特征在于,在所述步驟S33中,所述數據預處理模塊利用所述Python完成對所述目標圖像和所述風格圖像的顏色格式的轉換并利用以下公式完成對對應顏色格式下對應數值的確定,其中,
當所述數據預處理模塊依次將所述目標圖像和所述風格圖像的RGB顏色格式轉化成YUV顏色格式時,該目標圖像中的YUV值的計算方式如下:
Y=0.299×R+0.587×G+0.114×B;
U=-0.169×R-0.331×G+0.5×B;
V=0.5×R-0.419×G-0.081×B;
當所述數據預處理模塊將所述目標圖像的YUV顏色格式轉化成RGB顏色格式時,該目標圖像中的RGB值的計算方式如下:
R=(Y-16)+1.140×(V-128);
G=(Y-16)-0.394×(U-128)-0.581×(V-128);
B=(Y-16)+2.032×(U-128)。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州宏途數字科技有限公司,未經廣州宏途數字科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310658892.3/1.html,轉載請聲明來源鉆瓜專利網。





