[發(fā)明專利]常用字不拆分的編碼方法無效
| 申請?zhí)枺?/td> | 200710055089.1 | 申請日: | 2007-09-03 |
| 公開(公告)號: | CN101114199A | 公開(公告)日: | 2008-01-30 |
| 發(fā)明(設(shè)計)人: | 袁長寶;王惠芳 | 申請(專利權(quán))人: | 袁長寶;王惠芳 |
| 主分類號: | G06F3/023 | 分類號: | G06F3/023 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 451150河*** | 國省代碼: | 河南;41 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 常用字 拆分 編碼 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及一種中文信息處理技術(shù)三碼以上的常用字不拆分的編碼方法。
背景技術(shù)
目前漢字的輸入方法是“漢語拼音”和“五筆字型”輸入方法。漢語拼音輸入漢字的優(yōu)點:易學習,只要會拼音就會打字。缺點是:重碼多,容易產(chǎn)生別字。大量的同音字翻頁時一不留神翻過去,倒回重來,影響打字速度,浪費人們的寶貴時間。盡管有了狂拼輸入漢字的新方法,提高了打字速度,卻依然存在著修改、翻頁、檢字的麻煩和別字的缺陷;特別是簽訂協(xié)議打印出的合同文書的別字,在經(jīng)濟全球化的今天,將會造成不可估量的損失。更為嚴重的是,容易造成“提筆忘字”。五筆字型輸入漢字的優(yōu)點:打字速度快,重碼率低,適合大批量處理文字。不足之處是,有些漢字的拆分,違背了漢字常規(guī)的書寫習慣,不利于漢字教學,并且增加了沉重的學習、記憶負擔,長時間不用,極容易忘記。
發(fā)明內(nèi)容
目前的漢字編碼一般是用“五筆字型”和“漢語拼音”輸入漢字。“五筆字型”學習難,“漢語拼音”打字慢,使?jié)h字輸入不盡完美。《信息處理用GB13000.1字符集漢字部件規(guī)范》將二萬多個漢字拆分為560個部件。在280個基礎(chǔ)部件漢字中,可拆分的漢字104個(略),二畫、交重、部分交重和不拆分的漢字111個(二十丁廠七卜八人入乂匕幾兒九刁了力刀乃又厶乜丈巾丸子孑孓也女豐井韋車屯中甘丹尹口曰曰日世凸凹目申甲電由冊弗母史吏曲串事五弋及牙戈內(nèi)專長氏為夬丑書本戔戊戉央必民西夷舟艮甫且皿更兩耳里我身垂重大萬夕久門丫之不止月心業(yè)丘臣臼州非),交重的非常用字63個(廿市丐丏卅旡禸冘卐卍爿毋冉冎束曳缶聿帇镸酉豕豖疌采臾禺禹<繁體、專用字35個>)。非漢字基礎(chǔ)部件280個(丨亅丿丶乛乚ナ匚丂冂勹亠冫丷冖マ巜丩卩凵丌廾尢囗彡夊丬彐屮彑巛耂爫灬肀歺曱甴乑癶襾戼丳刂?阝彳亻讠辶艸扌饣犭忄氵宀辶纟攵夂衤礻钅疒虍豸糹飠覀罒……)。
[丨丂凵勹丩屮巛彐口癶肀氺曱攵戼丳……都是有音可讀的漢字,因不常用,與現(xiàn)代漢語無意義,或者說是被現(xiàn)代漢語淘汰的漢字,本發(fā)明視作“非漢字基礎(chǔ)部件”,并無嚴格上意義上的“非漢字”]
用漢字的“聲母”,交重的非常用字的“代碼”或者非漢字基礎(chǔ)部件的“代碼”和一畫、二畫、交重、部分交重和不拆分的漢字的“漢語拼音字母”綜合編碼,使?jié)h字重碼少,別字率低,容易學習,不易忘記。本發(fā)明之目的就是提供一種三碼以上的常用字不拆分的編碼方法,其編碼方法解決的技術(shù)方案是:
1.用漢字的“聲母(b?c?d?f?g?h?j?k?l?m?n?p?q?r?s?t?w?x?y?z和零聲母a?e?o——下同)”分別作第一碼,再用該字拆分后常用字(變形漢字、《漢字偏旁名稱表》部首讀音——下同)的“聲母”或者交重的非常用字的“代碼(u——下同)”或者非漢字基礎(chǔ)部件的“代碼(a?o?e?u——下同)”作二、三、四碼編碼。最后一碼是非常用字用最后一個常用字的“聲母”(非漢字基礎(chǔ)部件的“代碼”——下同)編碼。
2.能拆分的非常用字,用該字的“聲母”作首碼,該字拆分后常用字的“聲母”或者交重的非常用字的“代碼”或者非漢字基礎(chǔ)部件的“代碼”作二、三、四碼編碼第一組。第二組用該字首筆“—橫(a),丨豎(o),丿撇(e),丶點(u),乛折(v)”的“代碼(a、o、e、u、v——下同)”作首碼,二、三、四碼與第一組“二、三、四碼”的編碼方法相同。交重的非常用字獨立作字時,先用該字全拼的漢語拼音字母編碼第一組,不夠四碼最后一碼是啥補啥,超過四碼舍棄,“zh、ch、sh”用“z、c、s”編碼,韻母“ü”用“u”編碼。第二組用該字首筆“—橫(a),丨豎(o),丿撇(e),丶點(u),乛折(v)”的“代碼”作首碼,二、三、四碼用“u”編碼。
3.二畫、交重、部分交重和不拆分的常用字,獨立作字時用該字全拼的漢語拼音字母編碼,不夠四碼最后一碼是啥補啥,超過四碼舍棄,韻母“ü”用“u”編碼;與其它漢字、部件組合時用其“聲母”編碼,“zh、ch、sh”用“z、c、s”編碼。
4.交重的異音字用其全拼的漢語拼音字母編碼;能拆分的異音字雙重編碼。
5.左邊是上下、上中下結(jié)構(gòu)的漢字——左邊不拆分。
6.二字詞用二字的“聲母”作第一、二碼,再用前一個字拆分后第一碼和后一個字拆分后第二碼的“聲母”作第三、四碼編碼;三字詞、四字詞用每個字的“聲母”編碼;五字以上詞用前三個字和最后一個字的“聲母”編碼;詞中的非常用字用“u”編碼。二畫、交重、部分交重和不拆分的常用字用其“聲母”編碼,“zh、ch、sh”用“z、c、s”編碼。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于袁長寶;王惠芳,未經(jīng)袁長寶;王惠芳許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200710055089.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字數(shù)據(jù)處理
G06F3-00 用于將所要處理的數(shù)據(jù)轉(zhuǎn)變成為計算機能夠處理的形式的輸入裝置;用于將數(shù)據(jù)從處理機傳送到輸出設(shè)備的輸出裝置,例如,接口裝置
G06F3-01 .用于用戶和計算機之間交互的輸入裝置或輸入和輸出組合裝置
G06F3-05 .在規(guī)定的時間間隔上,利用模擬量取樣的數(shù)字輸入
G06F3-06 .來自記錄載體的數(shù)字輸入,或者到記錄載體上去的數(shù)字輸出
G06F3-09 .到打字機上去的數(shù)字輸出
G06F3-12 .到打印裝置上去的數(shù)字輸出





