[發明專利]一種面向文字識別的文字圖像收縮變形增強方法有效
| 申請號: | 202110669815.9 | 申請日: | 2021-06-17 |
| 公開(公告)號: | CN113392772B | 公開(公告)日: | 2022-04-19 |
| 發明(設計)人: | 李旭東;黃輝輝;王靜一;黃永科;張海洋;張玉志 | 申請(專利權)人: | 南開大學 |
| 主分類號: | G06V30/32 | 分類號: | G06V30/32;G06V10/56;G06V10/774;G06K9/62;G06N20/00 |
| 代理公司: | 天津耀達律師事務所 12223 | 代理人: | 侯力 |
| 地址: | 300071*** | 國省代碼: | 天津;12 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 面向 文字 識別 圖像 收縮 變形 增強 方法 | ||
本發明公開了一種面向文字識別的文字圖像收縮變形增強方法,屬于計算機領域。一種面向文字識別的文字圖像收縮變形增強方法包括:獲取“原文字圖像”尺寸及顏色信息;創建一個與“原文字圖像”尺寸相同的空白“新文字圖像”;設置“原文字圖像”和“新文字圖像”具有相同的基準點;設置收縮變形系數k;遍歷“新文字圖像”上的每一個像素點R,根據收縮變形函數f(d)計算出在“原文字圖像”上對應的像素點P,并將“新文字圖像”上的像素點R的顏色值設置為“原文字圖像”中像素點P的顏色值;完成“新文字圖像”的生成。本發明將給定的文字圖像進行收縮變形來建立新風格的文字圖像,從而豐富機器學習的訓練數據集,并提高文字識別的準確率。
技術領域
本發明屬于計算機領域,主要關注如何提高基于機器學習算法文字識別的準確率,特別是漢字識別的準確率。
背景技術
近些年采用機器學習、AI深度學習等算法進行文字識別已經成為重要的途徑。這類算法需要讓計算機從人類社會活動的經驗即數據中來獲取知識、構建復雜多層次的概念模型。印刷體文字的識別已經達到非常好的效果,但是對于手寫體文字的識別還需要做大量的工作。
對于手寫體文字,每個人的書寫風格不同,甚至每個人的不同成長時期的書寫風格也不盡相同。在采用機器學習算法時,搜集大量不同人的所書寫的文字是比較困難的,另外訓練集的文字與測試集的文字也可能是不同人所書寫的,因此要實現一種通用的、光譜的基于機器學習的文字識別就更加困難。
發明內容
本發明目的是為了提高基于機器學習算法漢字識別的準確率,提供一種面向文字識別的文字圖像收縮變形增強方法。
本發明通過對已有訓練集中不同人所書寫的文字圖像進行收縮變形處理從而生成更多風格的文字圖像案例,這些新風格的文字圖像可能包含了更多人的書寫風格,從而擴大了文字訓練集,從而有助于提高基于機器學習的文字識別準確率。
本發明可對包括漢字在內的各種文字字體進行訓練集擴充。
面向文字識別的文字圖像收縮變形增強方法包括:獲取“原文字圖像”尺寸及顏色信息;創建一個與“原文字圖像”尺寸相同的空白“新文字圖像”;設置“原文字圖像”和“新文字圖像”具有相同的基準點;設置收縮變形系數;遍歷“新文字圖像”上的每一個像素點R,根據收縮變形函數f(d)計算出在“原文字圖像”上對應的像素點P,并將“新文字圖像”上的像素點R的顏色值設置為“原文字圖像”中像素點P的顏色值;完成“新文字圖像”的生成。
本發明的技術方案
一種面向文字識別的文字圖像收縮變形增強方法,包括具體步驟如下:
第1、輸入待收縮變形的文字圖像,該文字圖像簡稱為“原文字圖像”;
第2、獲取第1步中的“原文字圖像”的背景顏色值C、以及尺寸大小即寬W和高H;
第3、建一個新的空白文字圖像簡稱“新文字圖像”,該“新文字圖像”的尺寸與原文字圖像的尺寸相同,該“新文字圖像”上每個點的像素值均設置為“原文字圖像”的背景顏色值C;
第4、選取“原文字圖像”的中心點作為基準點O,其坐標為(ox,oy);
所述的“基準點”也可以選取文字圖像上的任意一個點作為“基準點”替換中心點;
第5、設置“新文字圖像”的基準點O與“原文字圖像”的基準點坐標相同;
第6、設置收縮變形系數k的值,k值的取值范圍為大于等于1的正整數;
第7、遍歷“新文字圖像”上的每一個像素點R,其坐標為(rx,ry),執行如下子步驟:
第7.1、計算“新文字圖像”上的像素點R和“新文字圖像”上的基準點O形成的OR線段與X軸的夾角α的值,公式為
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南開大學,未經南開大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110669815.9/2.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





