[發明專利]一種中文打印字符圖像合成方法及裝置在審
| 申請號: | 201710423248.2 | 申請日: | 2017-06-07 |
| 公開(公告)號: | CN107274345A | 公開(公告)日: | 2017-10-20 |
| 發明(設計)人: | 李宏宇 | 申請(專利權)人: | 眾安信息技術服務有限公司 |
| 主分類號: | G06T3/40 | 分類號: | G06T3/40;G06T11/60 |
| 代理公司: | 上海東信專利商標事務所(普通合伙)31228 | 代理人: | 楊丹莉,李丹 |
| 地址: | 518000 廣東省深圳市前海深港合作區前*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 中文 打印 字符 圖像 合成 方法 裝置 | ||
技術領域
本發明涉及光學字符識別領域,尤其涉及一種打印字符圖像合成方法及裝置。
背景技術
證件和票據中的打印字符圖像識別是光學字符識別(OCR)領域的一個分支,不同于手寫體識別,它更側重于識別出現在圖像中的機器打印字符,是語言依賴的。
中文打印字符識別要比英文字符識別更加復雜,因為中文字符類別繁多,比如:在國家中文標準字符集國標GB2312中僅一類字和二類字就有6763種。
識別這么多種字符需要一個很好的深度學習模型,而訓練一個好的深度神經網絡模型(DNN)則需要大量的高質量訓練樣本,該樣本要不僅能夠覆蓋每個中文字符,而且每個字符都能有上千種變化,并且能夠體現出不同應用場景中的背景變化。
迄今為止沒有任何公開的大型中文打印字符集,而為數千種中文字符手動設計生成不同訓練樣本也是不現實的。目前,中文字符集合擴展主要采用非線性變換的方式進行一些簡單的預處理,還有一些是通過融入扭曲模型來生成字符變種。
然而,這些方法沒有能夠形成一套整體方案,尤其是無法適應各種應用需求變化。因此,亟需一種中文打印字符圖像合成方法,該方法能方便快速地擴展生成中文打印字符及合成中文打印字符圖像,并適應各種應用需求。
發明內容
本發明的目的之一是提供一種中文打印字符圖像合成方法,該方法能方便快速地擴展生成中文打印字符及合成中文打印字符圖像,并滿足關于中文打印字符圖像的各種應用需求。
根據上述目的,本發明提出了一種中文打印字符圖像合成方法,其包括步驟:
S101:接收用戶輸入的字符需求或圖像字符,生成相應的標準字符;
S102:接收用戶輸入的背景圖像,生成相應的背景模板;
S103:接收用戶輸入的變換需求,根據所述變換需求對所述標準字符進行變換,以生成相應的字符擴展集;
S104:將字符擴展集中的擴展字符與背景模板合成,生成合成字符圖像。
本發明所述的中文打印字符圖像合成方法的提出是為了滿足關于中文打印字符圖像的各種應用需求。該應用需求可以包括為訓練深度神經網絡模型提供大量的高質量訓練樣本,通常該樣本不僅能夠覆蓋每個中文字符,而且每個字符都能有上千種變化,并且能夠體現出不同應用場景中的背景變化,從而使得可以基于經所述訓練樣本訓練的深度神經網絡模型有效識別類別繁多的中文字符。
本發明所述的中文打印字符圖像合成方法根據用戶提供的字符需求或圖像字符、背景圖像以及變換需求生成合成字符圖像,其中:
步驟S101中:為了合成字符圖像,首先需要生成標準字符。該步驟根據用戶輸入的字符需求或圖像字符生成相應的標準字符。所述字符需求可以包括對字體的指定,可以根據所述字符需求通過字符庫生成相應的標準字符。所述圖像字符是以圖像形式給出字符,可以對所述圖像字符進行處理以生成相應的標準字符。
步驟S102中:為了模擬不同背景圖像場景,該步驟根據用戶輸入的背景圖像生成相應的背景模板,該背景模板用于步驟S104中字符圖像的合成。
步驟S103中:為了模擬不同字符變形場景,該步驟根據用戶輸入的變換需求對所述標準字符進行變換,生成相應的字符擴展集,該字符擴展集中的擴展字符用于步驟S104中字符圖像的合成。
步驟S104中:該步驟將字符擴展集中的擴展字符與背景模板合成,生成合成字符圖像。由于所述擴展字符和背景模板分別模擬了不同背景圖像場景和不同字符變形場景,因此所述合成字符圖像模擬了不同背景圖像和不同字符變形結合的場景,以該合成字符圖像作為深度神經網絡模型的訓練樣本不僅能夠覆蓋每個中文字符,而且每個字符都能有上千種變化,并且能夠體現出不同應用場景中的背景變化,從而使得可以基于經所述訓練樣本訓練的深度神經網絡模型有效識別類別繁多的中文字符。
從以上可以看出,本發明所述方法能方便快速地擴展生成中文打印字符及合成中文打印字符圖像,并且可以滿足關于中文打印字符圖像的各種應用需求。
本發明所述的中文打印字符圖像合成方法中,S102和S103的順序可以互換。
進一步地,本發明所述的中文打印字符圖像合成方法中:
當用戶輸入的為圖像字符時,步驟S101包括:從圖像字符中切分和提取出圖像中所含的字符,對該字符進行二值化處理和縮放變換后生成所述標準字符,再將所述標準字符保存為相應的標準字符圖像;
當用戶輸入的為字符需求時,步驟S101包括:根據所述字符需求,自動生成對應的字符,對該字符進行二值化處理生成所述標準字符,再將所述標準字符保存為相應的標準字符圖像。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于眾安信息技術服務有限公司,未經眾安信息技術服務有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710423248.2/2.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





