[發(fā)明專利]基于時間序列的漢字輸入法預(yù)測方法在審
| 申請?zhí)枺?/td> | 202110107710.4 | 申請日: | 2021-01-27 |
| 公開(公告)號: | CN113190124A | 公開(公告)日: | 2021-07-30 |
| 發(fā)明(設(shè)計)人: | 左洪年 | 申請(專利權(quán))人: | 中科曙光(南京)計算技術(shù)有限公司 |
| 主分類號: | G06F3/023 | 分類號: | G06F3/023 |
| 代理公司: | 南京蘇高專利商標(biāo)事務(wù)所(普通合伙) 32204 | 代理人: | 柏尚春 |
| 地址: | 211805 江蘇省*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 時間 序列 漢字輸入法 預(yù)測 方法 | ||
本發(fā)明公開了一種基于時間序列的漢字輸入法預(yù)測方法,包括如下步驟:步驟100:選取用戶歷史輸入作為訓(xùn)練集,訓(xùn)練用戶的時間序列模型;步驟200:利用時間序列模型預(yù)測各漢字在鍵入時間出現(xiàn)的次數(shù)生成預(yù)測結(jié)果;步驟300:根據(jù)用戶已經(jīng)鍵入的漢字或拼音,結(jié)合語義從預(yù)測結(jié)果中選擇出現(xiàn)次數(shù)較高的漢字作為推薦漢字顯示。根據(jù)上述技術(shù)方案的基于時間序列的漢字輸入預(yù)測方法,通過時間序列模型預(yù)測用戶在輸入時間時需要輸入的漢字,結(jié)合用戶輸入習(xí)慣,提高用戶的輸入速度及準(zhǔn)確度。
技術(shù)領(lǐng)域
本發(fā)明涉及計算機技術(shù)領(lǐng)域,特別涉及一種基于時間序列的漢字輸入法預(yù)測方法。
背景技術(shù)
目前,隨著信息技術(shù)的不斷發(fā)展,電腦、手機及平板電腦等電子設(shè)備應(yīng)用越來越廣泛。人們需要借助軟硬鍵盤對漢字進行輸入功能,以便實現(xiàn)工作、娛樂和交流等目的。對于計算機而言,輸入輸出是最基本的功能。而近年來對于漢字錄入電子設(shè)備需求量也越來越大。很多輸入法都提供對漢字的錄入功能。但是由于漢字的特殊性,輸入一個拼音往往對應(yīng)多個漢字,從而造成輸入速度慢、準(zhǔn)確率低等問題,極大的降低了輸入法的使用效率。
發(fā)明內(nèi)容
發(fā)明目的:本發(fā)明的目的是提出一種基于時間序列的漢字輸入法預(yù)測方法,可以針對不同用戶的輸入習(xí)慣為用戶做出特定推薦,提高文字的輸入效率及準(zhǔn)確度。
技術(shù)方案:本發(fā)明所述的基于時間序列的漢字輸入法預(yù)測方法,包括如下步驟:
步驟100:選取用戶歷史輸入作為訓(xùn)練集,訓(xùn)練用戶的時間序列模型;
步驟200:利用時間序列模型預(yù)測各漢字在鍵入時間出現(xiàn)的次數(shù)生成預(yù)測結(jié)果;
步驟300:根據(jù)用戶已經(jīng)鍵入的漢字或拼音,結(jié)合語義從預(yù)測結(jié)果中選擇出現(xiàn)次數(shù)較高的漢字作為推薦漢字顯示。
進一步的,所述步驟300后還包括步驟400:采用損失函數(shù)衡量預(yù)測結(jié)果的精確程度。
進一步的,所述步驟400中的損失函數(shù)為二次損失函數(shù)。
進一步的,所述步驟100包括:
步驟110:選取用戶歷史輸入作為訓(xùn)練集,建立用戶漢字時間序列;
步驟120:驗證用戶漢字時間序列的平穩(wěn)性,若用戶漢字時間序列平穩(wěn)則進入步驟130;
步驟130:判斷用戶漢字時間序列是否為白噪聲序列,若用戶漢字時間序列為非白噪聲序列,則計算訓(xùn)練集的自相關(guān)系數(shù)和偏相關(guān)系數(shù)并獲得訓(xùn)練集的自相關(guān)圖和偏自相關(guān)圖;
步驟140:根據(jù)自相關(guān)圖和偏自相關(guān)圖識別用戶漢字時間序列類型,并根據(jù)序列類型建立模型方程;
步驟150:對模型方程進行定階;
步驟160:利用觀測數(shù)據(jù)估計模型方程的參數(shù),獲得時間序列模型。
進一步的,所述步驟120還包括:
步驟121:若用戶漢字時間序列不平穩(wěn),則對用戶漢字時間序列進行差分處理并返回步驟120。
進一步的,所述步驟120中采用單位根驗證法驗證用戶漢字時間序列的平穩(wěn)性。
進一步的,所述步驟150中采用最大似然法估計模型方程的參數(shù)。
進一步的,所述步驟160中采用赤池信息準(zhǔn)則對模型方程進行定階。
有益效果:與現(xiàn)有技術(shù)相比,本發(fā)明具有如下優(yōu)點:通過時間序列模型預(yù)測用戶在輸入時間時需要輸入的漢字,結(jié)合用戶輸入習(xí)慣,提高用戶的輸入速度及準(zhǔn)確度。
附圖說明
圖1為本發(fā)明的第一實施例的預(yù)測方法的流程圖;
圖2為本發(fā)明的第二實施例的預(yù)測方法的流程圖;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中科曙光(南京)計算技術(shù)有限公司,未經(jīng)中科曙光(南京)計算技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110107710.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F3-00 用于將所要處理的數(shù)據(jù)轉(zhuǎn)變成為計算機能夠處理的形式的輸入裝置;用于將數(shù)據(jù)從處理機傳送到輸出設(shè)備的輸出裝置,例如,接口裝置
G06F3-01 .用于用戶和計算機之間交互的輸入裝置或輸入和輸出組合裝置
G06F3-05 .在規(guī)定的時間間隔上,利用模擬量取樣的數(shù)字輸入
G06F3-06 .來自記錄載體的數(shù)字輸入,或者到記錄載體上去的數(shù)字輸出
G06F3-09 .到打字機上去的數(shù)字輸出
G06F3-12 .到打印裝置上去的數(shù)字輸出





