[發明專利]漢字造字方法和設備、構造字體庫的方法有效
| 申請號: | 201110459270.5 | 申請日: | 2011-12-31 |
| 公開(公告)號: | CN103186511B | 公開(公告)日: | 2017-03-08 |
| 發明(設計)人: | 唐英敏;馬蕾;劉洋;王晨曦;劉金妮;欒瑛;于萍萍 | 申請(專利權)人: | 北京大學;北大方正集團有限公司;方正信息產業控股有限公司;北京北大方正電子有限公司 |
| 主分類號: | G06F17/22 | 分類號: | G06F17/22 |
| 代理公司: | 北京天昊聯合知識產權代理有限公司11112 | 代理人: | 羅建民,鄧伯英 |
| 地址: | 100871*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 漢字 造字 方法 設備 構造 字體庫 | ||
技術領域
本發明屬于字體庫技術領域,具體涉及一種漢字造字方法和設備、構造字體庫的方法。
背景技術
在電子設備中,漢字是以字符編碼(如Unicode、GB2312等)形式表示的;但字符編碼僅僅是電子設備內部的代碼,一個漢字要被以一定字體(如黑體、宋體等)顯示或打印出來必須要用到字形數據,字形數據可為輪廓圖、點陣圖、矢量圖等形式,用于規定該漢字是什么“樣子”的;而構造一個漢字的字形數據并將其與字符編碼對應起來的過程就稱為“造字”。顯然,不同字體庫中同一漢字的字形數據不同,因此當要構造一個新字體庫時要進行大量的造字工作。
現有的漢字造字方法通常是字體設計師先用一種字體設計出常用的幾百個漢字,之后工作人員再以這些常用漢字為基礎,根據感覺一筆一畫的造出其它漢字的字形數據并進行調整。
發明人發現,現有技術中至少存在如下問題:現有漢字造字方法是人工逐字進行的,效率低下、花費時間長(構造常規的萬字左右的字體庫通常需要數月),成本高,尤其當要為含幾十萬漢字的超大字體庫(例如用于漢字研究領域的字體庫)造字時,工作量就更加龐大;同時,字體庫不論多大都不可能包括人們可能用到的全部漢字,故當用戶用到一些字體庫中沒有的字(如生僻字或自造字),這些字就不能顯示或不能按所需的字體顯示。
發明內容
本發明所要解決的技術問題包括,針對現有技術中的漢字造字方法效率低、成本高、無法實時造字的問題,提供一種效率高、成本低、可實時造字的漢字造字方法。
解決本發明技術問題所采用的技術方案是一種漢字造字方法,包括:
獲取所要構造的漢字的字符編碼、部件編碼、結構編碼,并根據所述部件編碼從漢字部件庫中提取相應的漢字部件,其中所述結構編碼規定所述漢字的結構及所述漢字部件在所述漢字中的位置;
用所述漢字部件根據所述結構編碼生成所述漢字的字形數據,并將所述漢字的字形數據與字符編碼相對應。
其中,“漢字部件”是指漢字中相對獨立的結構單元,其可按不同的方法劃分。例如,漢字部件可以是“筆畫”,如橫、點等,也可以是“偏旁部首”,如單人旁、利刀旁、寶蓋頭等,還可以是漢字的組成部分,如“發”字下邊的“又”以及去掉“又”后剩余的“”可分別作為一個漢字部件。值得注意的是,漢字部件還與其大小、形狀有關,故筆畫和結構相同的單元可能是不同的漢字部件,例如,“可”字和“于”字最上邊一筆都是“橫”,但這兩橫的寬度、形狀不同,故可被認定為兩個漢字部件;再如,“國”字和“喝”字中均有“口”,但二者的尺寸、形狀不同,故可被認定為兩個漢字部件。當然,由于漢字數量極多,因此不可能將每個漢字的每個結構單元都認定為單獨的漢字部件,對多個相似度較高的結構單元,可只選取其中的一個作為漢字部件;比如,若認為“晶”字中的三個“日”部件形態雖有差別但差別不大,可只選取其中的一個作為漢字部件??傊?,漢字部件的劃分沒有絕對的標準,但從方便的角度說,通??蓪h字中較常見的、相對獨立的、形態較相似的結構單元作為一個漢字部件。
優選的是,在所述獲取所要構造的漢字的字符編碼、部件編碼、結構編碼之前,還包括:從漢字部件獲取單元獲取漢字部件,為所述漢字部件賦予部件編碼以構造漢字部件庫。
進一步優選的是,所述漢字部件獲取單元包括筆跡記錄單元、圖像獲取單元、圖像處理單元、數據存儲單元中的至少一種。
進一步優選的是,所述構造漢字部件庫還包括:獲取所述漢字部件庫中的漢字部件的部件參數,所述部件參數包括部件高度、部件寬度、部件高寬比、部件面積、部件黑白比、部件重心、部件來源字符、部件原位置、部件推薦位置中的至少一種。
優選的是,所述結構編碼為ISO?10646標準中的IDS屬性的結構編碼。
優選的是,所述獲取所要構造的漢字的字符編碼、部件編碼、結構編碼包括:通過輸入設備獲取所要構造的漢字的字符編碼、部件編碼、結構編碼;或通過預存的編碼對應表獲取所要構造的漢字的字符編碼、部件編碼、結構編碼,所述編碼對應表中存儲有所要構造的漢字的字符編碼、部件編碼、結構編碼的對應關系。
優選的是,所述用所述漢字部件根據所述結構編碼生成所述漢字的字形數據包括:
步驟1、根據所述結構編碼將所述漢字部件置于指定位置,得到中間字形;
步驟2、判斷所述中間字形的字形參數是否符合預訂值,是則進行步驟5,否則進行步驟3;
步驟3、根據所述字形參數與預訂值的差別調整所述中間字形;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京大學;北大方正集團有限公司;方正信息產業控股有限公司;北京北大方正電子有限公司,未經北京大學;北大方正集團有限公司;方正信息產業控股有限公司;北京北大方正電子有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110459270.5/2.html,轉載請聲明來源鉆瓜專利網。





