[發明專利]一種用于電子、信息及通信系統的交換內碼及其應用無效
| 申請號: | 200810218455.5 | 申請日: | 2008-10-17 |
| 公開(公告)號: | CN101382931A | 公開(公告)日: | 2009-03-11 |
| 發明(設計)人: | 勞英杰 | 申請(專利權)人: | 勞英杰 |
| 主分類號: | G06F17/22 | 分類號: | G06F17/22;G06F17/30 |
| 代理公司: | 廣州新諾專利商標事務所有限公司 | 代理人: | 劉菁菁 |
| 地址: | 200031上*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 用于 電子 信息 通信 系統 交換 內碼 及其 應用 | ||
技術領域
本發明涉及一種交換內碼,特別是一種對任一種文字的字元、部首、筆畫、字母、符號或圖形統一編碼的用于電子、信息及通信系統的交換內碼。
背景技術
現代電腦系統交換內碼的標準(American?Standards?Code?for?InformationInterchange),簡稱ASCII,開始是7位元表示1字節,為27;以128個合表示一些控制鍵、大小寫拉丁字母及阿拉伯數字;及後以二進制28表示1字節,擴充至256個編碼組合表示,包含某些西歐國家的交換內碼需要;1967年并于瑞士的日內瓦建議成為國際組織標準(International?Organization?for?Standardization),簡稱ISO。全球經濟發展都需要現代電腦系統交換及顯示相同信息,所以必需統一內碼,隨著亞洲個別國家及地區的需要,不同國家及地區都相繼以不同方式及位元數量進行編碼。包括日本工業標準(Japan?Industrial?Standard/JIS)、TRON、臺灣的Big-5、香港地區的Big-5加上香港增補字符集(Hong?Kong?Supplementary?Character?Sets/HKSCS)、韓文及中國的GBK,最早是簡體字編碼的GB2312、及後包含繁體字的GB18030等。以上亞洲個別國家及地區的文字應用都有一共同點,都是使用簡體或繁體漢字,而當中有大部份的漢字字型是相同的,但編碼表示方法不同,就完全不能互相兼容;其數量差距相當大,由數千至數萬不等。互聯網的興起,世界文字的編碼表示方法亦隨著產生變化,互不兼容的問題導致不能在互聯網顯示不同的世界文字,催生Unicode的出現。從1990年開始,首先把七千多個的世界文字編碼,然后再將二萬多個中日韓使用的漢字編碼;及後再加入生僻的世界文字及漢字,應付整理各地古藉的需要,至目前為止共有十萬個字容量。目前,不斷出現的中階及高階電腦程序語言,及以電腦程序語言寫成的操作系統都同時兼容Unicode,最新的標準是ISO10646,但其實對任何電腦或電子系統的硬件來說,用Unicode編碼的電腦程序語言,巨大的位元量對任何運算都會造成極大負擔。Unicode的缺點主要是沿用最早期的編碼方法,導致要擴大字庫時,必需要按照舊有方式橫向發展,但以28橫向發展;其產生的運算量極大,雖能滿足編碼的需要,卻拖慢了電腦或電子系統的排序等運算能力。而且,Unicode的編碼方法及邏輯并不符合大部份國家及地區的文字發展需要;例如,對成千上萬個的漢字系統,可用二百多個部首分類,但Unicode并未把二百多個部首全部置入Unicode內,數萬個漢字編碼的位置非常混亂,無法做到部首與漢字系統間的邏輯屬性對應關系,令漢語學者無法處理古藉內碼的交流需要。以下為8位1字節的編碼組合列表分析:
表1
Unicode的編碼系統內予留了私人造字空間,用戶可以自行以不同文字符號安放在造字區內;但這私人造字區的設置,卻不能以交換碼方式進行公眾傳遞。一直以來,Unicode的發展,并不是以固定長度方式編碼;西方的常用字母字節編得較少,罕用的文字符號編得較多,較多的位元量不容易實現高效率排序。目前,電腦程式語言的發展要解決兼容問題,都以Unicode為內碼,直接令大部份程式語言的空間擴大,加大記憶空間及硬體的負擔。
目前的文字信息數據編碼方法,其主要目的是為了擴大編碼組合數量及準確記錄文字字型,文字記錄語義,西方的文字是以字母串組織語義;東方的中國是是以方塊漢字組織語義。從ASCII到Unicode的編碼發展,都并沒有對任何文字或字母在語義屬性方面進行編碼。電腦和互聯網的發展產生了極大量的文字信息,信息全球化更是以幾何級數增加,及以關鍵詞撿索,但結果雖大量卻并不準確,因為海量信息是不可能以人手方式進行語義屬性分類。
世界上任何一種拼寫文字都由是長短不一的字符串所組成,對極大量不同長短的字符串進行排序需要耗費極大的運算成本。最有效的管理是以固定長度數據(Fixed-Length?Data)進行存儲及排序運算,自動地對任何一種文字所表達的信息實現語義屬性分類,從而以最快速度撿索出最具有語義關聯性的結果。海量信息的撿索,首要條件是先區分語義屬性,再在自動分類後的數據內進行深度挖掘;重新對文字或字母以屬性編碼是唯一讓文字具備分類語義的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于勞英杰,未經勞英杰許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200810218455.5/2.html,轉載請聲明來源鉆瓜專利網。
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置





