[發明專利]基于深度堆疊網絡的結構信息指導的中文字庫生成方法有效
| 申請號: | 201811376244.4 | 申請日: | 2018-11-19 |
| 公開(公告)號: | CN109635883B | 公開(公告)日: | 2023-04-18 |
| 發明(設計)人: | 連宙輝;江月;唐英敏;肖建國 | 申請(專利權)人: | 北京大學 |
| 主分類號: | G06V30/244 | 分類號: | G06V30/244;G06F40/109;G06N3/0464;G06V10/82;G06N3/08;G06T11/60 |
| 代理公司: | 北京萬象新悅知識產權代理有限公司 11360 | 代理人: | 黃鳳茹 |
| 地址: | 100871*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 深度 堆疊 網絡 結構 信息 指導 中文 字庫 生成 方法 | ||
本發明公布了一種手寫體中文字庫的自動生成方法,基于深度堆疊網絡和結構信息指導,通過書寫軌跡合成階段和字體風格渲染階段,采用兩階段的卷積神經網絡G對漢字骨架流場進行預測;首先從用戶書寫的少量手寫體漢字對書寫風格進行學習,從而合成未書寫漢字的書寫軌跡;并渲染為目標的手寫體風格;再生成具備該用戶書寫風格的完整的GB2312中文手寫體字庫文件。本發明方法可實現同時保證生成字形的結構準確性和風格一致性,簡單高效,成本低,質量高,能夠滿足普通人快速制作個性化手寫體字庫的實際應用需求。
技術領域
本發明屬于計算機圖形與圖像處理、人工智能和深度學習技術領域,涉及中文文字處理技術,尤其涉及一種基于深度堆疊網絡的結構信息指導的手寫體中文字庫自動生成方法,利用中文漢字結構信息等先驗知識和深度神經網絡,學習書寫風格并生成完整的中文字庫。
背景技術
個性化字體使得信息傳播更加生動、直觀。相比于規范的印刷字體,越多越多的人希望在電子移動設備中使用個性化字體,尤其是手寫體字體,來進行溝通和交流。一方面,個性化字體能將文本渲染為特有的書寫風格,更加靈活地表達書寫者的風格和感情;另一方面,個性化字體的視覺效果使得書寫者在各種社交網絡媒體中受到更多的關注。
目前來說,手寫體中文字庫的生成仍然是一件費時費力的工作。主要的原因包括:1)中文漢字結構復雜,即使是同一個漢字,不同書寫者的書寫風格差異大;2)英語或拉丁語字符集只包含極少量的字符,但是中文字符數量龐大,例如,最常用的GB2312字符集合包含6763個漢字;3)當前在電子設備上可用的手寫字體大部分是商業字體,它們由專業的字體設計師設計,每個字符都需要精細的調整。因此,對于普通人來說,快速制作手寫體字庫是一件很有挑戰的任務。
當前的漢字生成技術主要包括兩大類,基于計算機圖形學的方法和基于深度學習的方法。
基于計算機圖形學的方法利用中文字符的結構相關性,復用輸入字符集合的部件來合成未書寫的漢字。輸入集合的字符首先被拆分為預先定義好的筆畫或者部件,然后,未書寫的漢字通過提取的部件進行合成。然而,這一類方法通常需要人工設計大量的合成規則來優化部件的選擇和復用過程。
基于深度學習的方法使得漢字生成能夠通過端到端的方法解決。一方面,字體生成可以被當作風格遷移問題,帶有參考字體風格的漢字被遷移到一種特定的手寫體風格,同時盡量保證字符內容的一致性。另一方面,隨著生成對抗網絡的發展,可以得到更加逼真和高質量的漢字。但是,整個生成過程具有不可控性和不可預測性,模糊和虛假邊緣在生成的漢字圖像中難以避免。除此之外,對于結構復雜或者書寫風格潦草的漢字,端到端的方法經常得到不合理的筆畫甚至錯誤的漢字結構。
發明內容
為了克服上述現有技術的不足,本發明將漢字的領域知識和深度神經網絡進行結合,提出了一種基于深度堆疊網絡的結構信息指導的手寫體中文字庫自動生成方法,能夠解決現有的基于計算機圖形學的方法和基于深度學習的方法各自的缺陷。
在本發明方法中,字體生成任務被分解為兩個子任務(兩個階段),書寫軌跡的合成和字體風格的渲染。可以從用戶書寫的少量手寫體漢字對書寫風格進行學習,從而合成未書寫漢字的書寫軌跡,并渲染為目標的手寫體風格,最后可以生成具備該用戶書寫風格的完整的GB2312(包含6763個漢字)中文手寫體字庫文件。第一階段,每個手寫體漢字字符被表示為一系列拆分好筆畫的書寫軌跡,通過一個多級的基于卷積神經網絡的模型將書寫軌跡從參考字體風格遷移到目標字體風格;第二階段,合成的骨架圖像通過一個基于生成對抗網絡的模型恢復漢字形狀細節,尤其是在字符的輪廓邊緣。最后,本發明可以生成用戶未生書寫的漢字,得到包括6763個漢字的手寫體中文字庫。
為了實現上述目的,本發明采用的技術方案如下:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京大學,未經北京大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811376244.4/2.html,轉載請聲明來源鉆瓜專利網。





