[發(fā)明專(zhuān)利]一種基于中文語(yǔ)句輸入的漢字候選、定位與糾錯(cuò)方案在審
| 申請(qǐng)?zhí)枺?/td> | 201410317406.2 | 申請(qǐng)日: | 2014-07-03 |
| 公開(kāi)(公告)號(hào): | CN104049770A | 公開(kāi)(公告)日: | 2014-09-17 |
| 發(fā)明(設(shè)計(jì))人: | 任文 | 申請(qǐng)(專(zhuān)利權(quán))人: | 任文 |
| 主分類(lèi)號(hào): | G06F3/023 | 分類(lèi)號(hào): | G06F3/023 |
| 代理公司: | 暫無(wú)信息 | 代理人: | 暫無(wú)信息 |
| 地址: | 343100 江西省吉安市吉安*** | 國(guó)省代碼: | 江西;36 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 中文 語(yǔ)句 輸入 漢字 候選 定位 糾錯(cuò) 方案 | ||
技術(shù)領(lǐng)域:
本發(fā)明應(yīng)用于臺(tái)式電腦和筆記本電腦的實(shí)物鍵盤(pán)打字和手機(jī)和平板電腦的虛擬鍵盤(pán)打字,它適用于基于語(yǔ)句輸入模式的任何類(lèi)型的漢字編碼方法,如音碼、形碼、數(shù)碼等。
背景技術(shù):
目前的漢字輸入法打字技術(shù),基本是采用語(yǔ)句輸入。要實(shí)現(xiàn)語(yǔ)句輸入,其前提條件是,輸入的漢字編碼串可以做音節(jié)上的自然分割,使得編碼串的音節(jié)與組成語(yǔ)句的漢字之間能夠產(chǎn)生一一對(duì)應(yīng)關(guān)系,即:一個(gè)音節(jié)對(duì)應(yīng)一個(gè)漢字,一個(gè)漢字對(duì)應(yīng)一個(gè)音節(jié),有多少個(gè)音節(jié)就對(duì)應(yīng)多少個(gè)漢字,有多少個(gè)漢字就對(duì)應(yīng)多少個(gè)音節(jié)。這種對(duì)應(yīng)關(guān)系,使得漢字輸入法能夠以編碼串的方式一口氣的輸入下去不用停頓,而使對(duì)應(yīng)的漢字依靠智能方式組合成一句話(huà),這種輸入方式或模式,即稱(chēng)為智能語(yǔ)句輸入。
目前,語(yǔ)句輸入主要應(yīng)用在拼音輸入法上,下面是拼音輸入法語(yǔ)句輸入的一個(gè)例子:
目前的拼音輸入法基本上都采用智能語(yǔ)句輸入。
Mu’qian’de’pin’yin’s’r’f’ji’ben’shang’dou’cai’yong’zhi’neng’y’j’shu’ru。
上面例子中,編碼串之間,用分割符號(hào)【’】自然的分割了各個(gè)漢字的音節(jié),雖然在編碼串中混入了簡(jiǎn)拼【s’r’f】及【y’j】,但它們能夠很自然的與前后音節(jié)進(jìn)行分割。
其實(shí),語(yǔ)句輸入,并不限定于拼音輸入法,任何一種輸入法,包括形碼(如五筆)、數(shù)碼(如四角號(hào)碼)等,都能實(shí)現(xiàn)語(yǔ)句輸入,其一個(gè)前提條件就是編碼要能夠切分語(yǔ)句的音節(jié),并且做到音節(jié)與漢字之間的一一對(duì)應(yīng)。下面是五筆輸入法語(yǔ)句輸入的一個(gè)例子:
其實(shí)五筆輸入法也可采用語(yǔ)句輸入。
adwu’pudu’gg’tt’lwgy’tyi’ifcy’bn’sk’esu’etnh’ygkg’qkd’lwgy’tyi
形碼(如五筆)的單字,完整的編碼格式是四個(gè)字母為一個(gè)音節(jié),對(duì)應(yīng)一個(gè)漢字。如果形碼全以固定四個(gè)字母作為一個(gè)音節(jié)輸入一個(gè)漢字,很容易自然分割音節(jié),但由于形碼字根的選取及拆分漢字的特殊性,有的單字字根拆分不足,字母編碼達(dá)不到四個(gè),有的單字為了避重編寫(xiě)了簡(jiǎn)碼,這些編碼混合在一起時(shí)無(wú)法自然分割音節(jié),這就必須在輸入過(guò)程中凡不足四碼的單字編碼必須插入分割符號(hào),人工分割音節(jié),本例就是如此。
但是,畢竟電腦不是人腦,任何輸入法,語(yǔ)句輸入再怎么智能化,也不可能保證長(zhǎng)句輸入時(shí)100%的正確性,在輸入過(guò)程中,會(huì)遇到兩種情況,1、輸入的編碼錯(cuò)誤(誤打誤按鍵位)導(dǎo)致音節(jié)錯(cuò)誤,從而引發(fā)語(yǔ)句中的漢字錯(cuò)誤,2、輸入的編碼正確,音節(jié)正確,但由于同音字(重碼字)的干擾而引發(fā)了語(yǔ)句中的漢字錯(cuò)誤。
如果在打字過(guò)程中及時(shí)發(fā)現(xiàn)編碼錯(cuò)誤,可以迅速刪除修改;如果是高速盲打,閉著眼睛一氣呵成打完一連串編碼后發(fā)現(xiàn)中間的某個(gè)或某些漢字發(fā)生了錯(cuò)誤,要修改起來(lái)就麻煩了,通常的做法有三種:1、把整句話(huà)(包括錯(cuò)誤)打上屏幕,然后操作光標(biāo)(或鼠標(biāo))回到錯(cuò)誤處,刪除修改;2、直接在輸入法界面上操作光標(biāo)回到錯(cuò)誤處修改編碼;3、從編碼開(kāi)頭,一字一詞的選取編碼串音節(jié)對(duì)應(yīng)的正確的候選字詞上屏。
以上的操作都存在一定程度的麻煩,本發(fā)明,就是針對(duì)各種類(lèi)型的輸入法進(jìn)行語(yǔ)句輸入而設(shè)計(jì)的一套技術(shù)解決方案,它在輸入界面上采用數(shù)字對(duì)編碼串的音節(jié)和語(yǔ)句中的漢字進(jìn)行定位標(biāo)序,通過(guò)直接選擇數(shù)字鍵,快速候選漢字上屏,快速定位修訂和糾正錯(cuò)誤。
發(fā)明內(nèi)容:
一種基于中文語(yǔ)句輸入的漢字候選、定位與糾錯(cuò)方案,其特征是:利用鍵盤(pán)字符作為中文輸入法的編碼碼元,對(duì)漢字的單字及詞組進(jìn)行碼元編碼及輸入,在輸入編碼過(guò)程中,在電腦屏幕上顯示的輸入法界面上顯示輸入的漢字編碼串及中文語(yǔ)句,并依據(jù)編碼串的音節(jié)個(gè)數(shù)與語(yǔ)句中的漢字個(gè)數(shù)一一對(duì)應(yīng)的原理,在音節(jié)和漢字下面用數(shù)字進(jìn)行對(duì)應(yīng)的定位標(biāo)序,通過(guò)直接按序標(biāo)對(duì)應(yīng)的鍵盤(pán)數(shù)字鍵快速選擇漢字上屏、快速定位錯(cuò)誤處修訂和糾正錯(cuò)誤。
輸入法的輸入界面包含兩個(gè)區(qū)塊,分別為編碼區(qū)和候選區(qū),其中:
編碼區(qū)也稱(chēng)編碼行,用來(lái)顯示輸入的漢字編碼串,并對(duì)編碼串進(jìn)行正確的音節(jié)分割及分組,同時(shí)在音節(jié)下方,用不同的分組標(biāo)序數(shù)字對(duì)音節(jié)進(jìn)行順序定位標(biāo)序,以便利用鍵盤(pán)上的數(shù)字鍵對(duì)音節(jié)對(duì)應(yīng)的漢字進(jìn)行上屏候選。
候選區(qū)由多個(gè)候選行組成,用來(lái)顯示輸入的編碼可匹配的候選字、詞、句,并用一組數(shù)字對(duì)候選字、詞、句進(jìn)行候選順序標(biāo)序,以便利用鍵盤(pán)上的數(shù)字鍵對(duì)漢字進(jìn)行上屏候選;
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于任文,未經(jīng)任文許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410317406.2/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F3-00 用于將所要處理的數(shù)據(jù)轉(zhuǎn)變成為計(jì)算機(jī)能夠處理的形式的輸入裝置;用于將數(shù)據(jù)從處理機(jī)傳送到輸出設(shè)備的輸出裝置,例如,接口裝置
G06F3-01 .用于用戶(hù)和計(jì)算機(jī)之間交互的輸入裝置或輸入和輸出組合裝置
G06F3-05 .在規(guī)定的時(shí)間間隔上,利用模擬量取樣的數(shù)字輸入
G06F3-06 .來(lái)自記錄載體的數(shù)字輸入,或者到記錄載體上去的數(shù)字輸出
G06F3-09 .到打字機(jī)上去的數(shù)字輸出
G06F3-12 .到打印裝置上去的數(shù)字輸出
- 基于聊天大數(shù)據(jù)知識(shí)庫(kù)的機(jī)器人對(duì)話(huà)控制方法和系統(tǒng)
- 基于大數(shù)據(jù)搜索的幽默型機(jī)器人對(duì)話(huà)控制方法和系統(tǒng)
- 基于對(duì)話(huà)知識(shí)庫(kù)的機(jī)器人對(duì)話(huà)控制方法和系統(tǒng)
- 一種自然語(yǔ)言語(yǔ)句評(píng)價(jià)方法及裝置
- 句子級(jí)雙語(yǔ)對(duì)齊方法及系統(tǒng)
- 一種獲取相似語(yǔ)句的方法、裝置、存儲(chǔ)介質(zhì)及電子設(shè)備
- 一種翻譯模型結(jié)果重排序的方法及裝置
- 用于輸出信息的方法、裝置、設(shè)備以及存儲(chǔ)介質(zhì)
- 搜索推薦方法和裝置、服務(wù)器、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 文本識(shí)別方法、裝置、電子設(shè)備和可讀存儲(chǔ)介質(zhì)





