[發(fā)明專利]基于非完整識(shí)別的詞語快速輸入方法在審
| 申請(qǐng)?zhí)枺?/td> | 201210284415.7 | 申請(qǐng)日: | 2012-08-10 |
| 公開(公告)號(hào): | CN102937837A | 公開(公告)日: | 2013-02-20 |
| 發(fā)明(設(shè)計(jì))人: | 周紅全 | 申請(qǐng)(專利權(quán))人: | 上海驛創(chuàng)信息技術(shù)有限公司 |
| 主分類號(hào): | G06F3/023 | 分類號(hào): | G06F3/023;G06K9/00 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 200434 上海*** | 國(guó)省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 完整 識(shí)別 詞語 快速 輸入 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及聯(lián)機(jī)手寫識(shí)別技術(shù)中的詞語識(shí)別和輸入方法。
背景技術(shù)
目前用于聯(lián)機(jī)手寫識(shí)別輸入法主要有三種方式,一是單(整)字識(shí)別技術(shù),二是整句識(shí)別輸入技術(shù),三是疊寫輸入技術(shù)。
方式一是目前主流的技術(shù),其缺點(diǎn)在于,每個(gè)字都必須完整的寫完,用戶確認(rèn)識(shí)別結(jié)果后再寫下一個(gè)字,相對(duì)拼音等其他輸入法,輸入效率十分低下。
方式二是對(duì)方式一的改善,允許用戶一次書寫多字或整句,相對(duì)減小用戶和機(jī)器交互次數(shù),其缺點(diǎn)在于,每個(gè)字都必須完整寫完,用戶書寫時(shí)間并沒有減少,且一旦識(shí)別出錯(cuò),交互時(shí)間將大大增加,因此目前并不太流行。
方式三是對(duì)方式一的改善,允許用戶在書寫完第一個(gè)字時(shí),不等待識(shí)別結(jié)果繼續(xù)書寫第二個(gè)字,從而減小用戶和機(jī)器交互次數(shù),其缺點(diǎn)在于,每個(gè)字都必須完整寫完,用戶書寫時(shí)間并沒有減少,書寫強(qiáng)度反而提高了,且一旦識(shí)別出錯(cuò),交互時(shí)間將大大增加,是目前剛剛推出的一項(xiàng)新技術(shù)。
由于目前聯(lián)機(jī)手寫識(shí)別的理念和方法缺陷,造成中文手寫識(shí)別輸入效率很低,尤其是在手機(jī),平板電腦等觸摸屏上,大部分都沒有手寫筆,迫切需要一種使用方便,輸入正確率高,用戶書寫強(qiáng)度小的手寫識(shí)別輸入法。
發(fā)明內(nèi)容
本發(fā)明的目的在于克服目前聯(lián)機(jī)手寫識(shí)別輸入法現(xiàn)有技術(shù)的不足,提供了基于非完整手寫識(shí)別的詞語快速輸入方法。利用該方法,用戶不需要任何學(xué)習(xí),就能大大減少輸入強(qiáng)度,同時(shí)避免用戶在有些字不會(huì)完整寫的情況下而造成無法通過手寫識(shí)別來輸入的情況,相對(duì)于單字聯(lián)機(jī)手寫識(shí)別輸入法,可以把輸入效率提高幾倍。本發(fā)明的技術(shù)基礎(chǔ)是非完整手寫模式識(shí)別,基于此技術(shù),可以實(shí)現(xiàn)單字非完整手寫識(shí)別,詞語非完整手寫識(shí)別、拼音手寫聯(lián)合詞語輸入和詞語智能聯(lián)想手寫識(shí)別。其中詞語非完整手寫識(shí)別和拼音手寫聯(lián)合詞語輸入是本發(fā)明的核心。
本發(fā)明提供了一種供用戶快速、準(zhǔn)確手寫輸入的方法。該方法共包括四種方式,第一種方式為單字非完整手寫識(shí)別,第二種方式為詞語非完整手寫識(shí)別,第三種方式為拼音手寫聯(lián)合詞語輸入,第四種方式為詞語智能聯(lián)想手寫識(shí)別。
第一種方式:?jiǎn)巫址峭暾謱懽R(shí)別。所謂單字非完整手寫識(shí)別,就是用戶以手寫方式輸入其想要輸入的漢字時(shí),用戶可以以任何方式(包括連筆,草書等)來書寫,但關(guān)鍵的一點(diǎn)是,書寫的整個(gè)軌跡或筆跡可以不是一個(gè)完整意義上的漢字,即用戶僅僅需要書寫漢字的某一部分,系統(tǒng)把檢測(cè)得到的用戶書寫的整個(gè)軌跡與指定漢字范圍的每個(gè)漢字進(jìn)行匹配,從而得到每個(gè)漢字的預(yù)測(cè)識(shí)別概率,把指定漢字范圍內(nèi)所有漢字的預(yù)測(cè)識(shí)別概率從高到低排序后就得到了非完整手寫識(shí)別的預(yù)測(cè)候選字系列。單字非完整手寫識(shí)別的一個(gè)主要核心是漢字模板派生,所謂模板派生,就是對(duì)于每一個(gè)漢字,我們可以按照漢字的構(gòu)成進(jìn)行分解,同時(shí)也結(jié)合書寫過程派生出很多子字模板。這樣對(duì)于每一個(gè)子字模板,我們可以利用現(xiàn)有的整字識(shí)別算法讓用戶書寫軌跡與其進(jìn)行匹配,完成匹配后會(huì)得到一個(gè)匹配概率,將這個(gè)匹配概率乘以該子字模板在與之對(duì)應(yīng)的整字中的權(quán)重,就可以得到這個(gè)漢字的基于這個(gè)子字模板的一個(gè)預(yù)測(cè)識(shí)別概率。如果一個(gè)漢字含有多個(gè)整字和子字模板,則該漢字最終的預(yù)測(cè)識(shí)別概率取其全部模板匹配得到的所有預(yù)測(cè)識(shí)別概率中的最大值。每個(gè)漢字的子字模板事先都必須全部生成好。我們以“她”字為例,講述單字非完整手寫識(shí)別的原理,假設(shè)“她”共設(shè)計(jì)了四個(gè)模板,分別是T1“她”、T2“女”、T3“也”以及T4“女字和橫折鉤(也字第一筆)”。顯然模板T1是是一個(gè)完整的整字模板,模板T2,T3,T4均為“她”字派生的子字模板。四個(gè)模板的權(quán)重系數(shù)由模板自身的完整度通過計(jì)算來確定,假設(shè)分別為W1,W2,W3,W4,顯然W1為100%,其它3個(gè)模板的權(quán)重系數(shù)必定小于1,且W3大于W2。假設(shè)系統(tǒng)檢測(cè)到用戶書寫的軌跡,則系統(tǒng)把這個(gè)軌跡與每個(gè)漢字的所有模板(包括整字模板以及該漢字的子字模板)分別進(jìn)行匹配。在與“她”字進(jìn)行匹配時(shí),匹配過程為,將檢測(cè)到的軌跡分別與T1,T2,T3和T4按照既有的整字識(shí)別算法進(jìn)行匹配,此時(shí)必然得到4個(gè)匹配概率分別表示為P1,P2,P3和P4,那么P1*W1,P2*W2,P3*W3,P4*W4就是用戶書寫軌跡在與“她”字進(jìn)行匹配時(shí)得到的4個(gè)概率,取其中的最大值作為用戶書寫軌跡在與“她”匹配時(shí)的預(yù)測(cè)識(shí)別概率。由此可見,當(dāng)一個(gè)漢字H共有n個(gè)模板T(0),T(1)…T(n-1),則任意書寫軌跡與之匹配時(shí)均得到n個(gè)匹配概率P(0),P(1)…P(n-1),若每個(gè)模板的權(quán)重為W(0),W(1)…W(n-1),則該字最終的預(yù)測(cè)識(shí)別概率P(H)可以表達(dá)為:P(H)=MAX(P(i)*W(i))其中i=0,1,...,n-1,表達(dá)為該字的第i個(gè)模板,MAX表示取最大值。當(dāng)然在實(shí)際實(shí)施過程中,由于考慮連筆、草書等因素,預(yù)測(cè)識(shí)別概率還需考慮統(tǒng)計(jì)特征等其它因素。如果指定的漢字范圍中包含m個(gè)漢字,每個(gè)漢字表達(dá)為H(0),H(1)…H(m-1)。則通過上述方法,把用戶書寫軌跡與每個(gè)漢字進(jìn)行匹配后,我們將會(huì)得到每個(gè)漢字的預(yù)測(cè)識(shí)別概率P(H(0)),P(H(1))…P(H(m-1))。將此概率系列按照大小進(jìn)行排序后,就得到了與用戶書寫軌跡相對(duì)應(yīng)的預(yù)測(cè)識(shí)別候選字系列。因此,利用該方法可以達(dá)到用戶在不需要書寫完整漢字的情況下就能正確進(jìn)行預(yù)測(cè)識(shí)別。如果再結(jié)合其它輸入方式縮小漢字范圍后,將會(huì)大大提高預(yù)測(cè)精度。同時(shí)該方法也允許用戶自己創(chuàng)建、派生個(gè)性化模板,以輸入自己的一些獨(dú)特寫法,例如簽名等。該方式構(gòu)成了下列其它所有輸入方式的技術(shù)基礎(chǔ)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海驛創(chuàng)信息技術(shù)有限公司,未經(jīng)上海驛創(chuàng)信息技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210284415.7/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F3-00 用于將所要處理的數(shù)據(jù)轉(zhuǎn)變成為計(jì)算機(jī)能夠處理的形式的輸入裝置;用于將數(shù)據(jù)從處理機(jī)傳送到輸出設(shè)備的輸出裝置,例如,接口裝置
G06F3-01 .用于用戶和計(jì)算機(jī)之間交互的輸入裝置或輸入和輸出組合裝置
G06F3-05 .在規(guī)定的時(shí)間間隔上,利用模擬量取樣的數(shù)字輸入
G06F3-06 .來自記錄載體的數(shù)字輸入,或者到記錄載體上去的數(shù)字輸出
G06F3-09 .到打字機(jī)上去的數(shù)字輸出
G06F3-12 .到打印裝置上去的數(shù)字輸出
- 識(shí)別媒體、識(shí)別媒體的識(shí)別方法、識(shí)別對(duì)象物品以及識(shí)別裝置
- 一種探針卡識(shí)別裝置和方法
- 識(shí)別裝置、識(shí)別方法以及記錄介質(zhì)
- 識(shí)別裝置、識(shí)別系統(tǒng),識(shí)別方法以及存儲(chǔ)介質(zhì)
- 識(shí)別程序、識(shí)別方法以及識(shí)別裝置
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 識(shí)別裝置、識(shí)別方法以及識(shí)別程序
- 識(shí)別裝置、識(shí)別方法及識(shí)別程序





