[發(fā)明專利]電子設備的文本輸入系統(tǒng)及文本輸入方法有效
| 申請?zhí)枺?/td> | 201080051346.4 | 申請日: | 2010-10-11 |
| 公開(公告)號: | CN102640089A | 公開(公告)日: | 2012-08-15 |
| 發(fā)明(設計)人: | 本杰明·麥德洛克;喬納森·雷諾茲 | 申請(專利權)人: | 觸摸式有限公司 |
| 主分類號: | G06F3/023 | 分類號: | G06F3/023 |
| 代理公司: | 北京華夏正合知識產(chǎn)權代理事務所(普通合伙) 11017 | 代理人: | 韓登營;栗濤 |
| 地址: | 英國*** | 國省代碼: | 英國;GB |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 電子設備 文本 輸入 系統(tǒng) 方法 | ||
技術領域
本發(fā)明涉及電子設備的文本輸入系統(tǒng)及文本輸入方法,特別是指一種文本預測自適應加權的文本輸入系統(tǒng)及文本輸入方法。
背景技術
目前,存在著大量的電子設備文本輸入技術,例如,臺式電腦或筆記本電腦的標準鍵盤文本輸入,PDA(個人數(shù)字助理)市場中的手寫識別,使用移動電話9位數(shù)字鍵的字母字符輸入,標準及移動計算裝置的語音識別文本輸入系統(tǒng),以及觸屏裝置。
在移動電話技術中,有一些現(xiàn)存的文本輸入技術,其中比較有名的文本輸入技術包括特捷通訊公司(Tegic?Communications)的“T9”,摩托羅拉(Motorola)的“iTap”,Nuance通訊公司的“XT9”、“eZiType”和“eZiText”,黑莓的“SureType”,KeyPoint科技公司(KeyPoint?Technology)的“AdapTxt”和上海漢翔信息技術有限公司(CooTek)的“TouchPal”。這些技術大多是基于字符的文本輸入技術,并利用了一些文本預測(或歧義消除)技術。在不同的已知模型中,支持一本具有合法詞條的詞典(或多本詞典),并且詞典被賦予特定的輸入序列,文本輸入系統(tǒng)從該詞典中選擇一條(或一組)合法的詞條,并將該詞條作為潛在填充的候選詞條呈現(xiàn)給用戶。可由用戶輸入新的詞條來擴充上述基礎詞典,這一擴充受限于設備的可用內(nèi)存容量。
在這些文本輸入系統(tǒng)中,根據(jù)使用頻率的統(tǒng)計,在某些系統(tǒng)(諸如“eZiText”、“AdapTxt”、“TouchPal”)中根據(jù)即時的詞匯語境,對潛在填充的候選詞條進行排序。
發(fā)明內(nèi)容
本發(fā)明對這種僅以使用時間或頻率為依據(jù)進行文本預測排序的文本輸入系統(tǒng)進行了顯著的改進,其允許對受到已生成的諸如主題、類型或作者等高層文本特征影響的文本預測進行排序。
本發(fā)明由此提供了一個更加精確的文本輸入系統(tǒng)文本預測的排序方法,從而降低了用戶的文本輸入強度(因為用戶基本不必滾動預測詞條列表或輸入額外字符來找出他們的目標詞條)。
本發(fā)明提供了一種具有機器學習技術和分類能力的系統(tǒng),以便對用戶輸入的文本片段做出實時的分類預測。該系統(tǒng)使用分類預測重新排序和/或選擇由文本預測引擎生成的文本預測。然后將生成的文本預測呈現(xiàn)給用戶,以供用戶選擇輸入電子設備中的輸入文本。
利用分類預測對文本預測進行重新排序具有以下優(yōu)點,可將那些與當前文本主題/類型等最為相關的文本預測置于顯示列表的頂部供用戶選擇。由此使用戶的文本輸入更加便利。可將所述分類預測分級,以劃分出寬泛的分類,并在該分類中提取出精煉分類的文本預測。舉例來說,可將寬泛的“體育”分類劃分為任意數(shù)量的子類,并可繼續(xù)劃分這些子類。假設“體育”的一個子類為“足球”,則可將“足球”這一子類進一步劃分為“足球俱樂部”、“球員”、“球隊經(jīng)理”等子類。因此,本發(fā)明提供的文本輸入系統(tǒng)能夠從用戶輸入的文本中精確地預測出與該文本相關的分類。在此之后,該文本輸入系統(tǒng)可以通過減少不大可能出現(xiàn)在用戶輸入文本的給定分類文本預測中的文本預測的出現(xiàn)概率,來精煉由文本預測引擎(該引擎優(yōu)選生成基于字符的文本預測)生成的文本預測。
本發(fā)明提供了一種計算裝置的文本輸入系統(tǒng),該系統(tǒng)包括具有至少一個預測器的文本預測引擎,用于接收用戶輸入至計算裝置中的文本并使用所述預測器生成多條文本預測;分類器,用于接收輸入文本并生成至少一個文本預測分類;以及,加權模塊,用于接收所述文本預測和所述文本預測分類并使用所述文本預測分類加權所述文本預測以生成新的文本預測呈現(xiàn)給用戶。
優(yōu)選地,根據(jù)文本源訓練所述預測器。所述系統(tǒng)包括多個由單獨文本源訓練的預測器。優(yōu)選地,多個所述預測器同時生成多條文本預測。
在本發(fā)明的一個實施例中,所述系統(tǒng)還包括特征向量生成器,該特征向量生成器用于通過從所述輸入文本中提取特征,計算所述輸入文本中每個特征的詞條逆向文檔頻率并標準化結果向量為單位長度,來生成用以表示由用戶輸入至所述計算裝置中的文本輸入的特征向量。優(yōu)選地,所述特征向量生成器還用于通過從所述文本源中提取一組特征,計算所述輸入文本中每個特征的詞條逆向文檔頻率并標準化結果向量為單位長度,來為所述文本源或每個單獨文本源生成至少一個特征向量。
在本發(fā)明的一個優(yōu)選實施例中,所述系統(tǒng)還包括分類器訓練模塊,該模塊用于根據(jù)所述文本源生成的特征向量訓練所述分類器。優(yōu)選地,所述文本源包括至少用一個代表分類預先標記的文本數(shù)據(jù)。所述分類器可以是時序聚集感知分類器。優(yōu)選地,所述分類器用于生成與所述分類相關的置信度向量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于觸摸式有限公司,未經(jīng)觸摸式有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201080051346.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種異形零件彎曲治具
- 下一篇:一種發(fā)電機通風網(wǎng)板
- 同類專利
- 專利分類
G06F 電數(shù)字數(shù)據(jù)處理
G06F3-00 用于將所要處理的數(shù)據(jù)轉(zhuǎn)變成為計算機能夠處理的形式的輸入裝置;用于將數(shù)據(jù)從處理機傳送到輸出設備的輸出裝置,例如,接口裝置
G06F3-01 .用于用戶和計算機之間交互的輸入裝置或輸入和輸出組合裝置
G06F3-05 .在規(guī)定的時間間隔上,利用模擬量取樣的數(shù)字輸入
G06F3-06 .來自記錄載體的數(shù)字輸入,或者到記錄載體上去的數(shù)字輸出
G06F3-09 .到打字機上去的數(shù)字輸出
G06F3-12 .到打印裝置上去的數(shù)字輸出





