[發明專利]一種面向AI識別漢字的文字圖像扭曲變形方法有效
| 申請號: | 202110675196.4 | 申請日: | 2021-06-17 |
| 公開(公告)號: | CN113392780B | 公開(公告)日: | 2022-04-19 |
| 發明(設計)人: | 李旭東;黃永科;張海洋;王靜一;黃輝輝;張玉志 | 申請(專利權)人: | 南開大學 |
| 主分類號: | G06V10/774 | 分類號: | G06V10/774;G06V10/56;G06V30/32;G06K9/62;G06N20/00 |
| 代理公司: | 天津耀達律師事務所 12223 | 代理人: | 侯力 |
| 地址: | 300071*** | 國省代碼: | 天津;12 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 面向 ai 識別 漢字 文字 圖像 扭曲 變形 方法 | ||
本發明公開了一種面向AI識別漢字的文字圖像扭曲變形方法,屬于計算機領域。一種面向AI識別漢字的文字圖像扭曲變形方法包括:獲取“原文字圖像”尺寸及顏色信息;創建一個與“原文字圖像”尺寸相同的空白“新文字圖像”;設置扭曲變形頻率系數、扭曲變形初相系數和扭曲變形振幅系數;遍歷“新文字圖像”上的每一個像素點R,根據扭曲變形函數g(x)進行文字圖像的縱向扭曲變形、根據扭曲變形函數g(y)進行文字圖像的橫向扭曲變形。本發明通過扭曲變形來建立新風格的文字圖像,極大地豐富文字圖像的訓練數據集,從而提高基于訓練數據集的手寫體漢字識別算法的準確率。
技術領域
本發明屬于計算機領域,主要關注如何提高基于訓練數據集的手寫體漢字文字識別算法的準確率。
背景技術
當前對印刷體文字的識別已經相當實用,但是針對手寫體漢字文字的識別還需要做更多的工作。因為,對于手寫體,不同的人的書寫習慣、風格等各不相同,因此如果要很好地識別不同人的手寫體文字就需要搜集巨大的手寫體訓練數據集,這是非常困難的事情。
本發明通過對已有搜集到的不同人所書寫的手寫體訓練數據集進行一定的扭曲變形來生成更多風格的手寫體數據圖像,這些新的數據圖像集可以很好地接近一些未知書寫者的書寫風格,實驗證明本發明所給出的文字圖像扭曲變形方法非常有效,這表明本發明的方法能夠有效擴大了文字圖像訓練數據集,從而有助于提高基于訓練數據集的手寫體漢字文字識別算法的準確率
發明內容
本發明目的是克服現有技術的不足,提供一種面向AI識別漢字的文字圖像扭曲變形方法。
本發明通過對既有的文字圖像進項橫向和、或縱向扭曲變形來建立新風格的文字圖像,極大地豐富文字圖像的訓練數據集,從而提高基于訓練數據集的手寫體文字識別算法的準確率。
面向AI識別漢字的文字圖像扭曲變形方法包括:獲取“原文字圖像”尺寸及顏色信息;創建一個與“原文字圖像”尺寸相同的空白“新文字圖像”;設置扭曲變形頻率系數、扭曲變形初相系數和扭曲變形振幅系數;遍歷“新文字圖像”上的每一個像素點R,根據縱向扭曲變形函數g(x)進行文字圖像的縱向扭曲變形、根據橫向扭曲變形函數g(y)進行文字圖像的橫向扭曲變形。
本發明的技術方案
一種面向AI識別漢字的文字圖像扭曲變形方法,包括具體步驟如下:
第1、輸入待扭曲變形的漢字文字圖像,該文字圖像簡稱為“原文字圖像”;
第2、獲取第1步中的“原文字圖像”的背景顏色值C、以及尺寸大小即寬W和高H;
第3、建一個新的空白文字圖像簡稱“新文字圖像”,該“新文字圖像”的尺寸與原文字圖像的尺寸相同,該“新文字圖像”上每個點的像素值均設置為“原文字圖像”的背景顏色值C;
第4、設置扭曲變形頻率系數α的值,α值的取值范圍為大于0的正數;
第5、設置扭曲變形初相系數β的值,β值的取值范圍為大于等于0、且小于2π的正數;
第6、設置扭曲變形振幅系數k的值,k值的取值范圍為大于0、且小于H的正數;
第7、遍歷“新文字圖像”上的每一個像素點R,其坐標為(rx,ry),執行如下子步驟來進行縱向扭曲變形:
第7.1、根據縱向扭曲變形函數g(x)和“新文字圖像”上的像素點R的x軸坐標rx來計算對應的g(rx),g(x)的公式為
第7.2、如果g(rx)<ry<H+g(rx)-2k成立,則執行第7.3步;否則執行第7.5步;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南開大學,未經南開大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110675196.4/2.html,轉載請聲明來源鉆瓜專利網。





