[其他]漢字的音詞形編碼法無效
| 申請?zhí)枺?/td> | 86103903 | 申請日: | 1986-06-09 |
| 公開(公告)號: | CN86103903A | 公開(公告)日: | 1987-03-25 |
| 發(fā)明(設計)人: | 李東一 | 申請(專利權)人: | 李東一 |
| 主分類號: | G06F3/023 | 分類號: | G06F3/023 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 北京市東四西大*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 漢字 詞形 編碼 | ||
在電腦科學迅速發(fā)展,人類跨入信息化社會的今天,為了使十億人口頻繁使用的主要信息-漢語能夠高效率的傳輸,處理,應用,使電子計算機在中國得到迅速推廣普及,必須對漢字進行改革。雖然已發(fā)明多種漢字編碼方法,但都各有一定的局限性,為此研究了這種新的方法。它以音為基礎,以詞語為主,以拆形輔助區(qū)別同音字。用26個拉丁字母和10個數字碼中的1至5個字符組成一個編碼來表示一個漢字或一條詞語。通過字符個數和編碼結尾符號的不同來區(qū)別編碼的種類。
編碼包括三類十種編碼。三類是:單字碼,詞語碼,自編碼,十種編碼是:
一.單符單字簡碼。每個拉丁字母各代表一個高頻使用的漢字。
二.二符單字音碼。由兩個拉丁字母組成。表示與該字母雙拼發(fā)音相同的常用漢字。
三.二符雙字通用詞語碼。由兩個拉丁字母或一個拉丁字母一個數字碼組成,以分號;結尾。代表一條雙字詞語或兩個圖形符。
四.二符自編雙字詞語碼。由兩個拉丁字母或一個拉丁字母一個數字碼組成,以*號結尾。代表自己定義的任何兩個漢字或圖形符。
五.三符自編多字詞語碼。由三個拉丁字母或1至兩個拉丁字母和1至兩個數字碼組成,代表自己定義的任何多個漢字或圖形符。
六.四符雙字通用詞語碼。由四個拉丁字母按雙拼原則組成,代表與其發(fā)音相同的兩個漢字。
七.四符多字通用詞語碼。由四個拉丁字母或三個拉丁字母一個數字碼組成。字尾以分號結尾。代表一條常用的多字詞語。
八.四符多字專用詞語碼。由以拉丁字母開頭的四個字符組成。代表一條行業(yè)專用詞語。
九.五符單字碼。由五個拉丁字母組成,前兩個字母是雙拼音,代表一個發(fā)音與其相同的漢字,后三個字母用以區(qū)別同音字。
十.五符專用字詞碼。由以拉丁字母開頭的五個字符組成,代表一個漢字或一條專用詞語。
與現有其它方案比有以下特點:
一.把國家標準二級字庫的全部6763個單字的字碼同一萬條詞語的詞語碼融合在同一個編碼系統(tǒng)中,互不混淆,使用方便。編碼潛力大重碼率低,是一種新型的漢字拼音化改革方案。
二.是一種新型電報通訊碼。單字碼和詞語碼均有惟一性和可讀性,可作為代替老電報四碼的電報通訊碼。適于包括電傳打字機在內的各種終端使用。可以脫離計算機單獨譯碼,作為報文存儲和傳輸。由于以音為基礎易學,易記,易認使一般人易于直接掌握收發(fā)譯報。由于可用大量詞碼,平均碼長短,可縮短傳輸時間,節(jié)省大量電報費用。特別是在一定情況下,在報文中使用自編碼,可簡便地實現單位和個人的保密通訊。
三.是一種便于計算機漢字處理的編碼。由于把詞語分為通用詞語碼,行業(yè)專用詞語碼,自編碼三種。而后兩種可按計算機分類排序等特殊需要進行編碼,達到即可滿足計算機處理要求,又可輸出漢字,較好地解決了漢字詞語數量浩繁與計算機內存有限的矛盾。
四.是一種新的計算機漢字輸入編碼。以雙拼為基礎。規(guī)則簡單,易學,易記。對大量同音字除可拆字區(qū)分外,還可簡便地以詞定字。平均碼長短,輸入速度快,可以按口述盲打輸入,適于指揮機關使用。
五.允許各人根據自己習慣,愛好,方便,將日常工作中常用到的漢字,詞語進行自編碼,以自編碼形式存入系統(tǒng)中隨意使用。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于李東一,未經李東一許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/86103903/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:電機共控折彎機
- 下一篇:氰化鍍銀溶液無氰轉化方法





