[發明專利]一種位形碼輔以拼音碼的全字符結構串式輸入方法有效
| 申請號: | 202110394195.2 | 申請日: | 2021-04-13 |
| 公開(公告)號: | CN113050807B | 公開(公告)日: | 2023-07-18 |
| 發明(設計)人: | 宦秉煉 | 申請(專利權)人: | 昆明理工大學 |
| 主分類號: | G06F3/023 | 分類號: | G06F3/023 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 650093 云*** | 國省代碼: | 云南;53 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 位形碼輔 拼音 字符 結構 輸入 方法 | ||
1.一種位形碼輔以拼音碼的全字符結構串式輸入方法,其特征在于:利用位形碼和拼音對漢字和非漢字進行編碼,并與鍵盤上的字母對應,對文句進行結構串劃分,根據結構串取碼規則實現結構串輸入進而完成文句輸入;
一)漢字編碼構形
用于對漢字進行編碼的構形即為編碼構形,編碼構形包括根構形和擴展構形;
(1)根構形
根構形是最基礎的構形,共66個,包括:
(11)疊字構形
①二疊構形:由完全相同的兩部分組成,以‘‥’表示,編碼為U;
②三疊構形:由完全相同的三部分組成,以‘∴’表示,編碼為T;
③四疊構形:由完全相同的三部分組成,以‘∷’表示,編碼為Y;
(12)對稱類構形
①左右對稱或總體近似對稱構形,編碼為A;
②豎軸豎鉤軸近似對稱構形,編碼為A;
(13)端連構形
若干筆畫端部一一相連接或近似相連且不屬于其它定義的鏈接狀構形,編碼為L;
(14)折類構形
①順折構形:其書寫方向總體上是順時針方向旋轉的構形,編碼為B,其中豎鉤“亅”也當作順折處理;
②逆折構形:其書寫方向總體上是逆時針方向旋轉的構形,編碼為T;
③復折構形:其書寫既包括順時針走向也包括逆時針走向的構形,編碼為G;
(15)含交叉點構形
①含單交叉點構形
②含多交叉點構形
(16)特殊構形
為本輸入法所特有的幾個構形;
(2)擴展構形
擴展構形是在根構形的基礎上通過添加筆畫形成的構形,擴展構形和對應根構形的編碼相同;
其中一些擴展構形字右下角帶“.”,表示該字含特定附構形,基本上為該字內所含的筆畫結構,或筆畫的部位,附構形對應的編碼為附碼,是二級碼;
上述漢字編碼構形與鍵盤上字母鍵的對應關系如下表:
二)漢字的編碼
(1)漢字的編碼構形及編碼級別
所有漢字都是由編碼構形進行量測取碼,漢字中出現的構形分為3個級別,分別為一級構形、二級構形和三級構形,應對的編碼即為一級碼、二級碼和三級碼;
(11)一級構形
漢字取碼時,首先以最大的編碼構形對漢字進行量測比對,匹配上的編碼構形即為一級構形,為漢字的主要信息結構,其所對應的碼,即為一級碼,當一級構形不包含二級構形時,即為單一構形,否則稱為復合構形;
(12)二級構形
某些一級構形包含次級構形,為漢字結構的次要信息結構,包括如下四種:
①包容型復合構形及其內構形
編碼構形像容器一樣包含其它構形,被包含的構形即為該編碼構形的內構形,包容型復合構形與其內構形關系是兩者無交叉點,被包構形從整體上講,其上下左右至少三面被包鎖,只允許一個方向有出口;
②疊字復合構形及其內構形
疊字構形為一級構形,其中相同的一個部分稱為“等元”,對等元進行量測的構形即為二級構形,等元構形即為二級構形,對應的是二級碼,是一級構形的內構形;
③左右對稱復合構形及其內構形
左右對稱構形左側部分作為二級構形,是一級構形的內構形;
④特定復合構形及其內構形
指定28個漢字本身作為一級編碼構形,指定它們含特定的附構形,在其左下角以“.”表示該字為特定復合構形,其對應編碼如下表:
(13)三級構形
單一構形不含內構形,有時需進一步對它們本身所含更低層的構形進行取碼,這些更低層的構形即為三級構形,為漢字的最底層信息結構;
(2)基礎部件構形劃分
對于語委列出的560個基礎部件,它們有些屬于單一編碼構形,有些屬于復合構形,其余為含多個一級構形的組合,對基礎部件進行構形劃分編碼時,遵循以下原則:
a“構形數最小化”原則,即以少的構形來獲取一個基礎部件的信息;
b保留3筆及以上的正常書寫漢字,特別規定,某些基礎部件的上、下為“一”,保留構形“二”;
c將相交結構及端連結構組成構形;
d按上下型取構形;
e均衡原則,所取的各構形筆畫數均衡,并且為多筆構形;
f上部或書寫靠前的構形取較多筆畫;
(3)漢字編碼方法
(31)構形選取原則
采用對漢字進行構形量測匹配取碼,對GB13000.1所列的20902個漢字的完整編碼的最小碼長為3,最大碼長為4,而對擴展的6萬多漢字的最大碼長為5,編碼構形選取應遵循的原則是:
①“先主要后次要”原則,即首先以一級構形進行編碼,而先不管二級、三級碼,只有當一級構形編碼達不到碼長的要求時,再考慮次級的二級構形補充編碼,如果仍達不到碼長要求時,才最后訴諸三級構形編碼;
用公式表示如下:
漢字全碼=Left(一級構形碼+二級構形碼+三級構形碼,4)
上式表示對括號內逗號前面的組合字符串從左向右取4個字符,即如果前面字符串個數≤4,所取即為整個字符串,否則只是前面的4個字符,下面類同的表達式也為類推的表述,如果某字由3個“一級構形碼”組成,且均不含二級碼,則該字的全碼長就為3,不再利用三級碼;
②漢字取碼需對構形進行判斷劃分,劃分原則實際上就是劃分的優先級別,由高到底按以下順序進行:
a“構形數最少化”原則,以最少的構形完成對漢字的測量取碼,特別規定,上下各有一個孤立的“一”,且之間只有一個一級構形,則兩橫組成“二”構形;
b保留2筆及以上基礎部件常用字構形;
c將相交筆畫及端連筆畫組成構形;
d按上下型或左右取構形;
e均衡原則,所取的各構形筆畫數均衡,并且盡可能都為多筆構形;
f上部或書寫靠前的構形取較多筆畫;
(32)編碼方式
①含4個及以上一級構形的漢字編碼
按照如下取碼順序表選??;
即第1碼是在左上角取構形碼,然后緊鄰第1碼的右側取第2構形碼,接著轉至右下角取第3碼構形碼,第4碼為緊鄰第3構形的左側;
上表中共有4行,每一行稱為取碼同層,其中“1、2、16、15”為上同層,1位頂部等于、略低于或略高于其右側2位構形頂部,同樣2與16位具相同關系,“3、4、5、6”為下同層,下同層的判斷是:a.具有相同的筆畫最底部;b.構形重心大致相同;c.3位底部略高于4位底部,當遇到同層中兩個構形呈包夾嵌套在一起時,先取外夾構形,下同層全部取完后,才移轉到其上的“7、8、9、10”同層取碼;
②含不足4個一級構形的漢字編碼
漢字編碼不足4碼時,需考慮補充取二級內碼及三級碼,總的來說,單一構形本身的三級構形編碼,是從取碼順序表的1號位開始??;其他情況下,二級、三級取碼均從取碼順序表的3號位開始;
A單一編碼構形本身的編碼
單一編碼構形本身的取碼公式為:
編碼構形全碼=Left(其本身鍵位代碼+三級碼+γγγ,4)
其中γ表示百搭碼,代碼字母為“R”,其作用是在沒有其它信息編碼可利用但又必須占位時,就以此來充當,后面稱為補碼;
單一編碼構形不含二級內碼,需從取碼順序表的1號位取三級構形碼;
B單一復合構形的編碼
a只含1個內碼
復合編碼構形全碼=Left(其本身鍵位代碼+二級構形碼+二級構形的三級碼,4);
b含2個以上內碼
復合編碼構形全碼=Left(其本身鍵位代碼+各二級內碼,4);
C含2個一級構形字的編碼
按取碼順序表取完2個一級構形碼后,3、4碼按以下方式?。?/p>
a?2個一級構形均無內碼
左右型字:漢字全碼=Left(第1構形碼+第2構形碼+第2構形的三級碼+第1構形的三級碼,4);
其它型字:漢字全碼=Left(第1構形碼+第2構形碼+第1構形的三級碼+第2構形的三級碼,4);
b?2個一級構形中的一個含1個內碼,另一個不含內碼
漢字全碼=Left(第1構形碼+第2構形碼+內碼+另一構形的1個三級碼,4);
c?2個一級構形中的一個含多個內碼,另一個不含內碼
漢字全碼=Left(第1構形碼+第2構形碼+2個二級內碼);
d?2個一級構形中均含內碼
左右型漢字:2個一級碼+第2構形的內碼+第1構形的內碼;
其它型漢字:2個一級碼+第1構形的內碼+第2構形的內碼;
D含3個一級構形字的編碼
按取碼順序表取完3個一級構形碼后,若不含二級構形,則所取的3個一級碼即為完整全碼,不再取三級碼,否則逆向返回補取1個二級構形碼;
三)常用非漢字的編碼
對主要非漢字符的編碼規則大多以拼音讀音為依據,其他根據有關方式編碼:
(1)英語字母的編碼
采用字母加固定拼音字母方式編碼:
小寫字母編碼=本字母+xxy
大寫字母編碼=本字母+dxy
其中,xxy為“小寫英”的拼音首字母,dxy“大寫英”的拼音首字母;
另外,英語大小寫字母還有一種全角漢化的形式,其編碼為:
小寫字母編碼=本字母+xxh;
大寫字母編碼=本字母+dxh;
(2)數字及數字序號的編碼
阿拉伯數字的編碼采用鍵位移植法,即將1~0數字編碼順序安排到其下的Q~P鍵上取碼;
數字編碼=Q~P+szm,其中,szm為“數字碼”的拼音首字母;
帶圓括號的數字序號(1)~(10),帶圓括號的數字編碼=Q~P+yks,其中,yks為“圓括數”的拼音首字母;
另外,全角漢化數字編碼為:
漢化數字編碼=Q~P+hsz;
其中,hsz為“漢化數字”的拼音首字母;
數字序號均為一級碼;
(3)標點符號的編碼
標點符號主要以其名稱的拼音為依據,個別,指最常用的逗號和句號,采用移植法,具體對應編碼如下表:
(4)希臘字母的編碼
綜合其讀音和形狀與英語字母的對位關系進行編碼,具體對應編碼如下表:
(5)數學符號首碼
常用數學符號大部分根據拼音讀音,少數采用構形,具體對應編碼如下表:
(6)拼音特定字母的編碼
拼音特定字母編碼=對應字母+聲調碼+py(拼音)
聲調碼指1~5聲“陰平、陽平、上聲、去聲”對應的碼為“Q?W?E?R”,輕聲及其他為T,ü以v代替;
(7)俄文字母編碼
俄文字母編碼主要根據讀音前2字母安排;
俄語小字母編碼=讀音前2字母+ex[俄小];
俄語大字母編碼=讀音前2字母+ed[俄大];
(8)日文假名編碼
日文假名主要根據讀音編碼;
平假名編碼=讀音前2字母+pi[平];
片假名編碼=讀音前2字母+pa[片];
小體以“x”作為第4碼;
(9)韓語字母編碼
韓語字母編碼主要是以構形編碼;
(10)其他符號的編碼
其他符號較常用符號的編碼,它們基本上都以漢語讀音為編碼的依據,具體見下表:
四)結構串輸入
(1)純漢字結構串輸入的取碼規則
對于漢字起頭的結構串,第1字都是取2碼;
(11)2字結構串
2字詞編碼=1(1,2)+2(1,2)或者2字詞編碼=1(1,2)+2(1,2,3)
其中,1(1,2)表示取第1字的1碼和2碼,2(1,2)表示取第2字的1碼和2碼,2(1,2,3)表示取第2字的前3碼;
(12)3字結構串
3字詞編碼=1(1,2)+2(1,2)+3(1,2)
其中,3(1,2)表示取第3字的1碼和2碼,其他同前;
(13)4字結構串
4字詞編碼=1(1,2)+2(1)+3(1)+4(1,2)
其中,2(1)表示取第2字的1碼,3(1)表示取第3字的1碼,4(1,2)表示取第4字的1碼和2碼,其他同前;
(14)5字及以上結構串
多字詞編碼=1(1,2)+2(1)+3(1)+4(1)+5(1)
其中,4(1)表示取第4字的1碼,5(1)表示取第5字的1碼,其他同前;
(2)含非漢字結構串輸入的取碼規則
(21)常規含非漢字結構串
含非漢字結構串的輸入規則與上面純漢字結構串輸入的取碼規則一樣,不同的是,遇到非漢字字符,無論在什么位置,只取其1碼;
(22)某些特定字符串的編碼
①拼音的編碼
拼音結構串的編碼為:
拼音的編碼=Left(對應字母+聲調碼,6);
②兩字拼音組合編碼:
2字詞拼音組合編碼=Left[(1(ⅰ,ⅱ,ⅲ)+2(n),6]
其中,1(ⅰ,ⅱ,ⅲ)表示第1字的前3個拼音字母,2(n)表示第2字全部拼音字母,其中凡是以ch、sh、zh開始的,都以c、s、z代替。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于昆明理工大學,未經昆明理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110394195.2/1.html,轉載請聲明來源鉆瓜專利網。





