[發(fā)明專利]漢字規(guī)范五筆字型碼無效
| 申請?zhí)枺?/td> | 96105637.1 | 申請日: | 1996-05-04 |
| 公開(公告)號: | CN1164693A | 公開(公告)日: | 1997-11-12 |
| 發(fā)明(設(shè)計)人: | 李保源 | 申請(專利權(quán))人: | 李保源 |
| 主分類號: | G06F3/023 | 分類號: | G06F3/023 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 226002 江蘇省*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 漢字 規(guī)范 五筆字型 | ||
本發(fā)明涉及一種漢字筆形編碼方案。
本發(fā)明可用于計算機(jī)漢字輸入和辭書查檢漢字。
目前提出的各種漢字形碼編碼方案,或多或少都得考慮漢字的筆形信息。事實上,任何一個漢字毫無例外均可拆分為一組有序的筆畫序列,筆畫按運筆方向則可歸納為五種基本筆形:橫、豎(包括豎左鉤)、撇、掭、折,可以1、2、3、4、5加以編號;它們構(gòu)成了漢字形碼信息的基本單元。不同漢字間的一個主要區(qū)別即在于構(gòu)成漢字的筆畫序列,或筆形序列的區(qū)別上。但如果按漢字的筆形序列一筆一畫的在計算機(jī)上輸入,則既費時又煩瑣。因此各種形碼編碼方案均提出了各具特色的解決方法,但實質(zhì)均是對漢字的筆形序列進(jìn)行分段拆分,每一段成一組,并作為一個字元。不同編碼方案的區(qū)別僅在于字元的選取上。但迄今為止提出的各種形碼方案,其字元的選取,或者說對漢字筆形序列的分段拆分方法,大多缺乏嚴(yán)格的規(guī)則,沒有規(guī)律可循,因此不僅需要使用者硬性記憶,而且也僅能適用于某一特定漢字字符集,擴(kuò)充性差。較為有規(guī)律的有王永民的五筆字型和陳愛文的表形碼。五筆字型的字元編碼直接和字元的首兩筆筆形聯(lián)系,抓住了漢字結(jié)構(gòu)的基本信息,是一個相當(dāng)成功的編碼方案;缺點是:字元為一百多個,且均需記憶,字元的選取仍缺乏嚴(yán)格規(guī)則;而其最大的缺點是;相當(dāng)一部分字元不屬于漢字的部首;顯得不規(guī)范。表形碼的字元分類依據(jù)筆形組合的空間特征,其方案極具特色,但也顯得相當(dāng)生硬;漢字和英文畢竟是完全不同的兩種文字,漢字成千上萬、形狀變化多端,和26個英文字母類比,不可避免地會有例外;而這種編碼方案的最大缺點是重碼多,最后不得不借助手漢字的聲音信息,因此不能認(rèn)為是一種嚴(yán)格意義上的形碼編碼方案。
本發(fā)明的目的在于提出一種能對構(gòu)成漢字的筆畫序列進(jìn)行分段拆分的嚴(yán)格、統(tǒng)一、規(guī)范的編碼方案。此方案通過對漢字筆形序列,接一定規(guī)則進(jìn)行分段拆分,每一段成一組,并作為一個字元;每一字元均以首兩筆的筆形編號加以標(biāo)記,從而可將所有字元分為25類。字元數(shù)目不加限制,并且無須記憶。其最大優(yōu)點是:可對任意大小的漢字字符集進(jìn)行編碼,適合于所有會寫漢字的使用者。
本發(fā)明的目的可以通過下述五條編碼規(guī)則來達(dá)到。
一、對漢字筆畫序列進(jìn)行分段拆分、產(chǎn)生字元時依照下述4點進(jìn)行:
1、字型結(jié)構(gòu)的間隙處應(yīng)加以分段,例如:“昌”為上下結(jié)構(gòu)字型,“日”和“日”之間應(yīng)加以劃分,“仍”為左右結(jié)構(gòu)字型,“亻”和“乃”之間應(yīng)加以劃分;
2、選取27個高頻部首為主要字元,它們是:钅、木、氵、火、土、日、月、艸、竹、亻、宀、蟲、犭、疒、足、扌、衤、讠、纟、口、女、阝、山、石、辶、王、忄;“小”,“人”,“了”三字作為字元,但不作為主要字元;
3、將漢字筆畫依其相鄰間的關(guān)系分為六種筆型結(jié)構(gòu),它們是:
相離:即筆畫間有空隙,例如“奚”字中的“爪”字頭;
相連:即筆畫間沒有空隙,但又不相互交叉重迭,例如“奚”字中的“幺”字;
相交:即筆畫相互交叉重迭,例如“承”字中的豎筆和三橫構(gòu)成的部件;
成框:至少一個筆畫為折筆的相連筆畫組合,其特征是不形成封團(tuán)區(qū)域,僅和折筆相交的筆畫亦歸入其中;例如“巨”字中的“匚”,“丙”字中的“冂”,“骨”字中的“冂”和“冖”,“聿”中的“彐”,部首“勹”,“巾”字等;
成圈:至少一個筆畫為折筆的筆畫組合,其特征是筆畫本身構(gòu)成形如矩形形狀的封閉區(qū)域的邊界,和邊界相交的筆畫亦歸入其中,例如:“目”字中的“口”,“由”字,“曲”字等;
同類:連續(xù)書寫的相同筆畫,例如“匆”中的兩撇;
規(guī)定漢字筆畫不論屬于何種筆型結(jié)構(gòu),凡連續(xù)筆畫構(gòu)成主要字元和“小”、“人”、“了”字時均應(yīng)拆出,如“大”字拆為“一人”,“里”字拆為“日土”;
此外規(guī)定:
(1)相離的連續(xù)筆畫應(yīng)自成一組,作為一個字元;
(2)凡相連、相交筆畫序列中如具有成框、成圈、同類的筆型結(jié)構(gòu),其相應(yīng)筆畫均應(yīng)拆出,自成一組,單獨作為一個字元,例如“骨”拆為“冂冖月”,“匆”字拆為“勹”;
4、幾種特殊情況的處理:
(1)多橫和一豎或一撇相交構(gòu)成的部件中的相同橫筆不拆,例如“豐”和“”;
(2)下?lián)跷恢玫臋M筆不單獨拆出,例如“隹”字應(yīng)拆成“亻亠”;“丶”下的橫筆和“”下的橫筆不單獨拆出,并和上一筆畫一齊構(gòu)成字元;
(3)相離的對稱筆畫組合不拆,例如“祭”字中的“”;
(4)“雨”、“貝”、“戊”不拆;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于李保源,未經(jīng)李保源許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/96105637.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:溫室快速養(yǎng)鱉的方法
- 下一篇:斷電延時電燈開關(guān)
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F3-00 用于將所要處理的數(shù)據(jù)轉(zhuǎn)變成為計算機(jī)能夠處理的形式的輸入裝置;用于將數(shù)據(jù)從處理機(jī)傳送到輸出設(shè)備的輸出裝置,例如,接口裝置
G06F3-01 .用于用戶和計算機(jī)之間交互的輸入裝置或輸入和輸出組合裝置
G06F3-05 .在規(guī)定的時間間隔上,利用模擬量取樣的數(shù)字輸入
G06F3-06 .來自記錄載體的數(shù)字輸入,或者到記錄載體上去的數(shù)字輸出
G06F3-09 .到打字機(jī)上去的數(shù)字輸出
G06F3-12 .到打印裝置上去的數(shù)字輸出





