[發明專利]一種基于計算機的漢字結構優化方法及系統在審
| 申請號: | 202110250992.3 | 申請日: | 2021-03-08 |
| 公開(公告)號: | CN112861520A | 公開(公告)日: | 2021-05-28 |
| 發明(設計)人: | 伍曙光;韓金寶;陶天毅 | 申請(專利權)人: | 成都字嗅科技有限公司 |
| 主分類號: | G06F40/237 | 分類號: | G06F40/237;G06F40/268;G06F40/279;G06K9/68 |
| 代理公司: | 北京酷愛智慧知識產權代理有限公司 11514 | 代理人: | 盧蓉 |
| 地址: | 610000 四川省成都市自由貿易試*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 計算機 漢字 結構 優化 方法 系統 | ||
本發明提供了基于計算機的漢字結構優化方法及系統,方法包括以下步驟:獲取預設樣本庫中的樣字;對樣字進行細化,得到樣字的細化字;根據樣字及其細化字對預設字庫中所有的字進行細化,得到整個字庫的細化字;對整個字庫的細化字進行筆畫填充,得到商用字庫。該方法通過“細化?組合?限制?填充”步驟生成的字具有良好的規范性,符合商業用字的規范性標準,將生成的字放大后局部也更精準,可以作為商用字庫。該方法把優化過程的很大一部分轉化成了機器學習中的參數限制,大大降低了人工優化以及字體設計師的工作量,解決了現有方法中存在的需要耗費大量人力和時間的問題。
技術領域
本發明屬于字庫設計技術領域,具體涉及一種基于計算機的漢字結構優化方法及系統。
背景技術
傳統字庫設計的方法是由字體設計師設計所有漢字,再通過圖像處理等方式成為電子設備上可以使用的字體,這種設計方法需要消耗大量人力和時間。隨著進入人工智能時代,人工智能的方法也慢慢進入了字庫設計的領域中。
例如現有將人工智能應用于字庫設計的方法包括:讓用戶書寫一定數量的漢字,依據該用戶的書寫風格生成用戶特色的字體。這種設計思路為基于“風格遷移”的思路,即用機器學習的方式找到用戶書寫的字和標準字體(如宋體、黑體)中對應的那些字之間的關系,把這個關系用于其他字上,就可以生成帶有用戶個人風格的字體。
但是“風格遷移”的方法具有很多局限性,最主要的問題是這樣生成的字體毫無“規范性”可言,雖然風格繼承得很明顯,但遠遠不夠作為一個標準的、可商用的字庫。正是因為如此,“風格遷移”的方法往往應用于生成手寫字體,而不是規范性足夠的商用字體。
發明內容
針對現有技術中的缺陷,本發明提供一種基于計算機的漢字結構優化方法及系統,提高生成字的規范性,滿足商業用字的標準。
第一方面,一種基于計算機的漢字結構優化方法,包括以下步驟:
獲取預設樣本庫中的樣字;
對樣字進行細化,得到樣字的細化字;
根據樣字及其細化字對預設字庫中所有的字進行細化,得到整個字庫的細化字;
對整個字庫的細化字進行筆畫填充,得到商用字庫。
優選地,所述樣本庫的樣字由字體設計師設計得到;樣字為圖片格式。
優選地,所述對樣字進行細化,得到樣字的細化字具體包括:
對樣字進行細化,提取樣字的單像素骨架,得到樣字的細化字。
優選地,該方法在所述得到整個字庫的細化字之后,還包括:
當得到的細化字出現孤立像素點或像素點之間存在空缺時,利用拓撲不變量修正方法刪除孤立像素點,或將空缺的地方連起來;
當得到的細化字部分符合預期時,設置一與細化過程中目標函數對應的第一規范函數,使其得到的細化字符合預期;
當得到的細化字完全不符合預期、或者是不能被識別時,將該細化字對應的字加入樣本庫中,作為樣本庫的樣字。
優選地,所述細化字部分符合預期包括“點”筆畫細化后出現單一的點,沒有走向;或者是細化字中存在大弧度連接。
優選地,所述對整個字庫的細化字進行筆畫填充具體包括:
設置第二規范函數,利用第二規范函數和所述目標函數對整個字庫的細化字進行筆畫填充;
所述第二規范函數用于設置粗細系數、邊緣光滑度和版面風格。
優選地,所述粗細系數和生成字的像素數成正比,和細化字的像素成反比,受細化字中筆畫交叉數、圖形連通分支數影響。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于成都字嗅科技有限公司,未經成都字嗅科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110250992.3/2.html,轉載請聲明來源鉆瓜專利網。





