[發明專利]八碼筆順筆畫漢字編碼方法無效
| 申請號: | 00101487.0 | 申請日: | 2000-02-01 |
| 公開(公告)號: | CN1307263A | 公開(公告)日: | 2001-08-08 |
| 發明(設計)人: | 喻新堡 | 申請(專利權)人: | 喻新堡 |
| 主分類號: | G06F3/023 | 分類號: | G06F3/023 |
| 代理公司: | 江西省專利事務所 | 代理人: | 李衛東 |
| 地址: | 330046 江西*** | 國省代碼: | 江西;36 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 筆順 筆畫 漢字編碼 方法 | ||
本發明涉及一種漢字編碼方法,是一種選用漢字八種基本筆畫為碼元,按照漢字的筆順、筆畫構成漢字的不定長編碼的方法。
現有的漢字編碼方法中,音碼重碼率較高,形碼、音形碼的編碼規則都比較復雜,學習、使用較困難。已有的五種筆畫漢字編碼方法,碼元太少,重碼率較高。
本發明的目的在于提供一種重碼率較低,編碼規則簡明,可用于計算機鍵盤輸入的漢字編碼方法。
本發明的技術方案是以國家語言文字工作委員會制定頒布的《現代漢字通用字筆順規范》、現代漢語通用字表》為根據,把漢字的筆畫分為8類,作為碼元:
1、橫:符號為一????包括:(提)一(橫)
2、豎:符號為丨????包括:丨(豎)
3、鉤:符號為????包括:(豎鉤)
4、撇:符號為丿????包括:丿(撇)
5、點:符號為、????包括:丶(點)(捺)
6、左折:符號為??包括:及其他起筆后向左?????????????????????????????????偏折的單折筆畫
7、右折:符號為??包括:及其他起筆后向右?????????????????????????????偏折的單折筆畫
8、復折:符號為Z????包括:ㄋ二折及其以上折的????????????????????????????????折筆畫
按書寫漢字的筆畫順序,對每一筆畫賦于筆畫符號定義中對應的一符號,組成該漢字的編碼。上述8種筆畫符號可以對應計算機鍵盤中的某一鍵。進一步還可以規定上述8種筆畫符號對應計算機鍵盤的右邊的數字鍵區上的1-8個數字鍵。例如:漢字“工”編碼為:一丨一,對應數字鍵則編碼為121。漢字“豐”編碼為:一一一丨,對應數字鍵則編碼為1112。
本發明漢字編碼方法具有碼元少,編碼規則簡明,重碼率低等優點。根據對“信息交換用漢字編碼字符集·基本集”(GB2312-80)的6763個漢字進行編碼結果,出現四字的同碼字2組,三字的同碼字13組,二字的同碼字91組,靜態重碼率為1.8%。本發明編碼方法,以國家統一規范的漢字筆順筆畫為標準,通過學習與應用本發明的漢字編碼方法,可推動和促進我國文字規范化、標準化建設。
本發明編碼方法還可以方便地實現對漢字進行排序。我們首先設定筆畫符號順序,如順序依次設定為:一、丨、、丿、丶、、L、Z。然后對不同漢字的編碼從左到右逐符位進行比較,本位符號相同,則比較下一位,下一位是空的則排在非空位字的前面。字的順序與編碼的長度(也即筆畫數)無關。例如:“刀”、“才”、“木”三個字它們的編碼分別為:丿、一亅丿、一、丨丿、,因此它們的排序為:木、才、刀。本發明漢字編碼方法用于漢字排序時,比現有的按筆畫數多少排序方便,比部首排序法省事,比音序法因同序字少而容易確定。它用于中文圖書、資料檢索,字典編纂和使用,姓氏排序等,必定極為方便和快捷,不遜于拼音文字檢索。
如果為了免去對筆畫符號順序的記憶,利用已經熟悉的數字順序,也可將筆畫符號轉換成對應的數字,這樣看見數字就能知道漢字的前后了。在這里是從左至右逐位地比較數字的大小,而不是比較整個數字數值的大小。只是這種轉換成數字的辦法還得要記住數字與筆畫符號的對應,從記憶負擔上看,與不轉換相當。
為進一步減少同序字,增加定序的確定性,本設計對少數同碼字制定如下排序次規則:
A:設定部分筆畫符號中所含不同筆畫(稱子筆畫)的順序(左前右后):
一中一
、中????丶
中
L中L
Z中ㄋ
如果子筆畫也相同的不同漢字,則設定“先短后長”的原則(上述子筆畫的順序同樣貫徹了這一原則),比較筆畫的比例長度。
B、兩同碼字比較時,總的步驟是:先從首筆畫開始比較能否區別,若能區別,則作出排序,余下的筆畫不再考慮;不能區別,則再比較第二筆畫,以此類推,直至遇可區分筆畫為止。具體比較時,注意到:
a、若兩字中有子筆畫的不同,則先比較子筆畫。如下面幾組同碼字的排序分別是:
孑子??冷這??勻丹??外處??貝岡??戊龍??凡及
b、若兩字中子筆畫也相同,則再從首筆畫起,依次比較對應筆畫的比例長度。如下面幾組同碼又同子筆畫字的排序分別是:
未末??己已巳??亓開井??旦目且??刀力??景晾??豈屺
以此次規則再對基本字集中少數同序字進行排序,除兩組二字組外,其余均可區分排序,重序率降至不到萬之三,較好地確立了漢字排序的規定性。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于喻新堡,未經喻新堡許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/00101487.0/2.html,轉載請聲明來源鉆瓜專利網。





