[發明專利]標準鍵盤音形碼標記式輸入法有效
| 申請號: | 201410490123.8 | 申請日: | 2014-09-24 |
| 公開(公告)號: | CN104238767B | 公開(公告)日: | 2017-08-08 |
| 發明(設計)人: | 吳禮明;吳禮珍 | 申請(專利權)人: | 吳禮明;吳禮珍 |
| 主分類號: | G06F3/023 | 分類號: | G06F3/023 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 515500 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 標準 鍵盤 音形碼 標記 輸入法 | ||
一、技術領域:
標準鍵盤音形碼標記式輸入法是一種基于標準鍵盤采用23個簡拼字母鍵、2個介音字母鍵、1個標記引導鍵和10個數字標記鍵的中文輸入法,尤其涉及一種在拼音簡拼輸入中中文切詞方法。
二、背景技術:
標準鍵盤音形碼標記式輸入法是解決目前標準鍵盤拼音中文輸入法中在簡拼模式下單字、二字詞組輸入效率低下的中文輸入法,以新的拼音簡拼輸入模式為輸入主體,通過標記引導鍵和10個數字標記鍵共同組成的簡拼拼音輸入串,以單字、二字詞組、三字詞組和短語、四字及四字以上長詞和短語的輸入串特征直接完成對長句的分詞,以全新的詞庫來提升長句的生成準確率。在全拼輸入中,拼音輸入串bian可看作一個音節也可分解成兩個音節,bian究竟是(邊、便、變)還是bi’an(彼岸),tian究竟是(天、田)還是ti’an(提案),如:今天交提案的代表很多“jintianjiaotiandedaibiaohenduo”,按照現有的雙向匹配切詞也很難正確切詞。拼音作為漢字的輸入工具,避免漢字拼音化也是每個輸入法發明者需要認真考慮的一個問題。超級簡拼是這幾年發展起來的輸入方式,以一字一字母為輸入鍵,在成語和短語的輸入中效果最好,在單字和兩字詞組的輸入效果是最差的。現有的主流拼音輸入法由于需要使用簡拼全拼混合輸入技術,使其詞庫的容量得到提升的同時拼音串的長度也受到限制,無法容入更多的詞匯和短語,切詞方法也無法在長句中實現較高的準確率;簡拼全拼混合輸入技術需要的詞庫的詞進行一詞多編碼標識,故其詞庫詞的字數大受其限制,這在長句輸入時無法準確形成長句而會根據出現頻率和同現頻率形成不匹配的無語言意義的文字串;單音節詞是最基礎的詞匯,能夠獨立成詞,也能和其他語素組成詞,大量的高頻字都是單音節詞,而這個特性也成了現有切詞技術無法正確切詞的最大障礙。標準鍵盤音形碼標記式輸入法以大量的單音節詞作為標記字,以23個簡拼字母鍵、2個介音字母鍵建立簡拼字母輸入單元,可繼承超級簡拼在成語和短語的輸入中效果,在兩字詞組、三字詞組的輸入效果優于全拼,單字輸入以新的拼音簡拼輸入模式,套用申請號2014101561605“標準鍵盤40碼元形碼中文輸入法”中的首尾形碼拆分碼元,形成新的簡拼音形碼單字輸入方式,單字的輸入的效果優于現行的王碼五筆,以輸入串各自特征可直接完成對長句的輸入串分詞,以全新的詞庫來提升長句的生成準確率。
三、發明內容:
標準鍵盤音形碼標記式輸入法,一種基于標準鍵盤采用23個簡拼字母鍵、2個介音字母鍵、1個標記引導鍵和10個數字標記鍵的中文輸入法:以23個簡拼字母鍵、2個介音字母鍵建立簡拼字母輸入單元;再對簡拼字母輸入單元構建漢字標記組;以標記漢字建獨立的標記漢字詞庫,組成以標記漢字表、單字表、標記漢字二字詞庫、標記漢字三字詞組和短語庫、四字及四字以上長詞組和短語庫的簡拼字母輸入單元字、詞組和短語庫;字和詞組、短語所含字的輸入在輸入簡拼字母輸入單元后,通過10個數字標記鍵標記和標記引導鍵進行是與否的判別來對應相應的字庫或詞庫所含分支來完成輸入;以單字、二字詞組、三字詞組和短語、四字及四字以上長詞和短語的字符輸入串特征和詞庫進行正向匹配,從句首開始逐一匹配,直接完成對長句的字符輸入串的分詞。
首先將介音或韻母ü并入介音字母u中,v鍵作為標記/識別/引導鍵獨立存在,建立簡拼字母輸入單元:
1、以元音a、e、o開頭的零聲母音節輸入單元為開頭的韻母;
2、以聲母j、q、x開頭的音節輸入單元:①后續為韻母i、in、ing的音節輸入單元為開頭的聲母;②后續為介音i的音節輸入單元為開頭的聲母+介音i;③后續為介音u的音節輸入單元為開頭的聲母+介音u;
3、以聲母b、c、d、f、g、h、k、l、m、n、q、r、s、t、w開頭的音節輸入單元:①后續韻母為a、e、o開頭的音節輸入單元為開頭的聲母;②后續為介音i的音節輸入單元為開頭的聲母+介音i;③后續為介音u的音節輸入單元為開頭的聲母+介音u。
4、以y、z開頭的零聲母音節輸入單元:①后續韻母為a、e、o開頭的音節輸入單元為字母w或y;②后續為介音i的音節輸入單元為字母w或y+介音i;③后續為介音u的音節輸入單元為字母w或y+介音u。
以簡拼字母輸入單元所含標記字組按自由語素優先和頻率優先建立簡拼字母輸入單元第一和第二漢字標記組,第一漢字標記組含十個標記漢字,以數字1-0標記,第二標記組含十個標記漢字,以數字1-0標記。第一漢字標記組以單字虛詞、代詞、單音節方位詞、基數詞、單音節名詞、單音節動詞、單音節形容詞為構成主體。第二漢字標記組通過輸入v鍵引導進入輸入狀態。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于吳禮明;吳禮珍,未經吳禮明;吳禮珍許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410490123.8/2.html,轉載請聲明來源鉆瓜專利網。





