[發明專利]基于中文類型字符的結構編碼中文類型字符(CJK字符)的方法無效
| 申請號: | 200980154300.2 | 申請日: | 2009-12-28 |
| 公開(公告)號: | CN102272753A | 公開(公告)日: | 2011-12-07 |
| 發明(設計)人: | 趙仁杰 | 申請(專利權)人: | 趙仁杰 |
| 主分類號: | G06F17/22 | 分類號: | G06F17/22 |
| 代理公司: | 北京市中咨律師事務所 11247 | 代理人: | 劉薇;楊曉光 |
| 地址: | 法國*** | 國省代碼: | 法國;FR |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 中文 類型 字符 結構 編碼 cjk 方法 | ||
1.一種編碼中文類型字符的方法,包括以下步驟:
(a)按指定順序將所述字符細分成N個單元,所述順序對于所述字符是特定的;
(b)按所述順序將基本描述符與所述N個單元中的每一個相關聯,這些基本描述符的每一個基于其相關聯的所述單元的結構;
(c)定義由在步驟(b)定義的基本描述符組成的基礎標記,這些基本描述符按所述指定順序排列。
2.如權利要求1所述的方法,其中,在步驟(a)之前執行以下步驟:
檢查所述字符是否是正體,如果所述字符不是正體,則用所述字符的正體形式代替所述字符。
3.如權利要求2所述的方法,其中,所述指定順序是書寫組成所述字符的筆畫的順序。
4.如權利要求2所述的方法,其中,數量N等于4。
5.如權利要求2所述的方法,其中,包含筆畫的所述單元的每一個由基本塊組成,其可在所述單元中重復,所述基本塊在有限的字符列表中選擇。
6.如權利要求4所述的方法,其中,包含筆畫的所述單元的每一個由基本塊組成,其可在所述單元中重復,所述基本塊在有限的字符列表中選擇。
7.如權利要求6所述的方法,其中,對于所述單元的每一個,與該單元相關聯的所述基本描述符由表示所述基本塊在所述單元中出現的次數的重復指數和與所述基本塊相關聯的基礎組件組成,并且所述基本描述符基于所述基本塊的結構。
8.如權利要求7所述的方法,其中,所述基本塊屬于在表4和表5中列出的字符集合。
9.如權利要求8所述的方法,其中,所述基本描述符的每一個是一串字母數字字符。
10.一種對至少一個中文類型字符的集合分類的方法,包括以下步驟:
(a)檢查所述集合的所述至少一個字符是否是正體;
(b)如果所述至少一個字符不是正體,則用所述字符的正體形式代替所述至少一個字符;
(c)按照書寫組成所述至少一個字符的正體形式的筆畫的順序將所述至少一個字符的正體形式細分成4個單元,包含筆畫的所述單元的每一個由基本塊組成,其可在所述單元中重復,所述基本塊在有限的字符列表中選擇;
(d)按所述順序將基本描述符與這4個單元的每一個相關聯,這些基本描述符的每一個由表示所述基本塊在所述單元中出現的次數的重復指數和與所述基本塊相關聯的基礎組件組成,并且該基本描述符基于所述基本塊的結構;
(e)定義由在步驟(d)定義的基本描述符組成的基礎標記,這些基本描述符按所述順序排列;
(f)當所述至少一個字符具有多于一個的正體形式時,對于所述至少一個字符的每個其它正體形式,重復步驟(b)至(e)。
11.如權利要求10所述的方法,其中,所述集合具有多于一個的中文類型字符,所述方法還執行以下步驟:
(g)對于所述集合中的每個字符,重復步驟(a)至(f);
(h)對于所述集合中的每個正體字,將所述集合中具有與所述正體字相同的基礎標記的所有字符組合在一起,從而定義所述正體字的族;
(i)對于在步驟(h)中定義的每個族,向所述族中的每個字符分配指示符,其將該字符與同一族中的其它字符相區別;
(j)向所述字符分配結構標記,其由所述指示符和所述基礎標記組成。
12.如權利要求11所述的方法,其中,所述指示符包括:
-形式指示符,其從一組形式指示符中選擇,所述形式指示符表明所述字符的形式;
-層級指示符,其用于將具有相同的基礎標記和形式指示符的字符彼此區別;以及
-地區指示符,其從一組地區指示符中選擇,所述地區指示符取決于所述字符的地理起源。
13.如權利要求12所述的方法,其中,所述形式指示符表明所述字符是否是正體字、正體字的異體、字符的錯誤形式、字符的繁體形式、字符的簡體形式、字符的避諱形式、字符的回避形式、字符的詞根形式或字符的筆畫形式。
14.如權利要求13所述的方法,其中,所述地區指示符根據所述字符起源于中國大陸、日本、韓國、越南、臺灣、香港、澳門、朝鮮、新加坡、馬來西亞而不同。
15.如權利要求11所述的方法,其中,所述基本塊屬于在表4和表5中列出的字符集合。
16.如權利要求12所述的方法,其中,在步驟(j)后,將唯一的主結構標記分配給所述集合的每個字符,如下所述:
-如果字符僅有一個結構標記,則它的主結構標記是該結構標記;
-如果字符具有幾個結構標記,并且其中一個是正體形式,則主結構標記是該正體形式;
-如果字符具有幾個結構標記,并且沒有一個是正體形式,則主結構標記是具有最小層級指示符的結構標記,如果這些結構標記中的兩個或多個具有最小層級指示符,則主結構標記是這兩個或多個結構標記中具有最少非零基礎組件的結構標記。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于趙仁杰,未經趙仁杰許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200980154300.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:太陽能電池膠膜切斷整疊系統
- 下一篇:光纖陣列纜線及相關的光纖纜線和系統





