[發明專利]一種文字數字化編碼及數字國際公讀法無效
| 申請號: | 201210221823.8 | 申請日: | 2012-07-01 |
| 公開(公告)號: | CN103076890A | 公開(公告)日: | 2013-05-01 |
| 發明(設計)人: | 潘昌仁;潘紀鴻;潘歡 | 申請(專利權)人: | 潘昌仁 |
| 主分類號: | G06F3/023 | 分類號: | G06F3/023 |
| 代理公司: | 桂林市華杰專利商標事務所有限責任公司 45112 | 代理人: | 楊雪梅 |
| 地址: | 541001 廣西壯族*** | 國省代碼: | 廣西;45 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 文字 數字化 編碼 數字 國際 讀法 | ||
技術領域
本發明涉及漢字及世界文字的編碼處理技術領域,具體是一種文字數字化編碼及取碼方法,運用該方法能使世界各種文字轉換為阿拉伯數字,并對阿拉伯數字設定國際公讀法,設置語音輸入裝置與計算機連接,從而使世界各種文字在詞數碼的基礎上得以相互轉換的數字化編碼語音輸入法。
背景技術
21世紀人類全面進入數字化時代,文字的數字化將帶動語言的數字化。而世界文字的溝通,也離不開文字的數字化。
公元8世紀印度數字經歷國際一級跳而成為阿拉伯數字,一級跳使數字在世界民族間產生了兩種不同的物理形態:對于某些民族它是聲光兩系的,即在母語范圍內可公讀公用;但是,因為世界各民族大多是用各自母語來讀它,所以,對世界多數民族而言,一級跳反而使印度數字在國際領域里成為公用不公讀的光學單系計數工具。由于數字公用不公讀,人類雖發明了共同的計算機卻不能以整體意義上的“人”去與機器對話。
目前,國內外已出現數以萬計的輸入法,但所有輸入法都是適用于一國或一種語言的輸入法,迄今沒有能同時適用于世界各種語言文字的輸入法。國內外都在探討世界語言溝通的辦法,至今亦沒有突破性的發明。
發明內容
本發明的目的是針對現有技術的不足,提供一種文字數字化編碼及取碼方法,運用該方法能使世界各種文字轉換為阿拉伯數字,即世界各種文字在詞數碼的基礎上得以相互轉換的公共碼,以及與該公共碼配套的阿拉伯數字國際公讀法。
文字的零件是筆畫,本發明從數十種漢字筆畫中提取6種基本筆畫,在此基礎上用少于10個阿拉伯數字的數碼對其編列,從而將無限豐富的中華文化信息資源有序濃縮其中,輔之以發明人已獲得授權的專利ZL2005100208451.8?“漢語語音編碼輸入法”遂獲得本編碼及取碼方法。
實現本發明目的的技術方案是:
一種文字數字化編碼及數字國際公讀法,包括漢語語音編碼輸入法,文字數字化編碼及取碼方法、用該方法建立世界文字詞數碼大鏈及國際語種系數、以及阿拉伯數字的國際公讀法。
所述文字數字化編碼方法為:
1)將漢字的基本筆畫撇、點、橫、豎、角、彎作為碼形,用1、2、3、4、5、6作為碼號順序對應碼形撇、點、橫、豎、角、彎編碼;
2)設置附加碼8、9、0和備用碼7,其中
附加碼8,用于編碼漢字或世界文字中有關兩筆交叉的筆畫信息;
附加碼9,用于編碼漢字或世界文字中有關象形于阿拉伯數字“9”的筆畫信息;?
附加碼0,用于編碼漢字或世界文字中有關象形于阿拉伯數字“0”的筆畫信息,包括閉合式文字字形,也用于碼組缺碼時的補碼;
為避免重碼或需要語音印證或啟用母語系數時,根據具體需要,借用《漢語語音編碼輸入法》中的“7”?作為備用碼;
通過以上設置,就得到將文字轉換為阿拉伯數字的編碼—因主碼只有6個,簡稱為“華6碼”,簡寫為H-6。
華6碼中:碼號1對應碼形“撇”,“撇”的聲母為p;碼號2對應碼形“點”,“點”的聲母為d;碼號3對應碼形“橫”,“橫”的聲母為h;碼號4對應碼形“豎”,“豎”的聲母為sh;碼號5對應碼形“角”,“角”的聲母為j;碼號6對應碼形“彎”,“彎”的聲母為w。
申請人的發明專利《漢語語音編碼輸入法》中,聲型p對應數字1;聲型d對應數字2;聲型h對應數字3;聲型sh對應數字4;聲型j對應數字5;?聲型w對應數字6。
華6碼的碼號與《漢語語音編碼輸入法》的部分聲型碼恰相吻合,有利于漢語漢字的“語底數字”和“字底數字”互相印證。而此一印證突出地反映了“在漢字維系下漢語實現單音節高效載義”的中華特點。
用所述華6碼對世界文字進行取碼的方法為:
(1)用華6碼對漢語中的字、詞、句進行取碼的方法;
1)簡單漢字依筆順取碼,不足五碼以0補之;
2)復雜漢字按“前3后2?法”?或“大筆優先法”取5碼,略去部分筆畫碼;
3)雙音詞取碼按“前3加后2法”,即取第一個單字的前三碼,第二個單字取末二碼;
4)三音詞取碼按“312法”,即前一單字取前三碼,中間單字取第一碼,后一單字取末二碼;
5)四音詞取碼按“3112法”,即前一單字取前三碼,中間二單字各取第一碼,后一單字取末二碼;
6)常用多音詞集裝取碼按“3n12”,即前一單字取前三碼,中間n個單字各取第一碼,最后一單字取末二碼;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于潘昌仁,未經潘昌仁許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210221823.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:雙球頭組件以及包括雙球頭組件的雨刮器系統
- 下一篇:一種汽車保險杠支架





