[發明專利]一種字符輸入過程中展現候選項的方法及裝置有效
| 申請號: | 200810238915.0 | 申請日: | 2008-12-04 |
| 公開(公告)號: | CN101634927A | 公開(公告)日: | 2010-01-27 |
| 發明(設計)人: | 王硯峰 | 申請(專利權)人: | 北京搜狗科技發展有限公司 |
| 主分類號: | G06F3/048 | 分類號: | G06F3/048;G06F17/30 |
| 代理公司: | 北京集佳知識產權代理有限公司 | 代理人: | 逯長明 |
| 地址: | 100084北京市海淀區中關*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 字符 輸入 過程 展現 候選 方法 裝置 | ||
技術領域
本發明涉及輸入法技術領域,特別是涉及一種字符輸入過程中展現候選項 的方法及裝置。
背景技術
隨著計算機技術以及互聯網技術的普及與發展,一方面,用于實現計 算機字符輸入的輸入法系統越來越深入到人們的生活中,另一方面,用戶 對于輸入法系統的智能性要求也越來越高。
以中文拼音輸入為例,現有的輸入法系統是一個綜合了字音轉換和音 字轉換兩項技術的客戶端程序。所述字音轉換是指:從文字序列到拼音序 列的轉換,字音轉換(即注音)是拼音輸入法詞庫構建不可或缺的步驟,它將 系統詞條賦予拼音并作為部分先驗知識存儲于輸入法詞庫。所述音字轉換 是指:從拼音序列到文字序列的轉換,即調用詞條的先驗知識來對用戶的 拼音輸入進行有效的預測,獲得較能符合用戶需求的文字序列。這樣,當 用戶輸入拼音序列時,如果輸入法詞庫中存在匹配的文字序列,則可以將 該匹配的文字序列作為候選項展現給用戶,供用戶選擇;否則,如果輸入 法詞庫中不存在匹配的文字序列,則無法給出詞條候選項。
在輸入體驗中,人名詞條占輸入量的很大一部分,并且人名詞條一般 都具有很強的獨特性。一般的輸入法詞庫中通常只能保存極小一部分高頻 人名詞條,這對于中國人名數量來講是遠遠不夠的。因此,詞庫匹配技術 無法解決人名輸入的問題,使得用戶在輸入人名對應的拼音序列時,一般 需要通過回退修改、選字的方式完成人名詞條的輸入,所以對于大部分的 人名詞條輸入都經常會出現誤碼率高、輸入效率低的情況,導致整體的輸 入體驗下降。
為解決上述問題,現有技術可以通過把人名用字(包括姓氏、人名等人 名各個位置上的字)信息及人名組合信息存儲為人名概率表,然后通過對用戶 輸入的拼音序列中人名拼音序列的識別,通過人名用字組合的方法自動給出一 個或多個候選人名,即從姓氏、人名資源出發構造一些可能是用戶需要的人名 詞條呈現給用戶,從而可以提高用戶輸入人名詞條時的輸入效率。
但是,該現有技術在展現人名候選項時具有較強的盲目性,對于某些可能 存在歧義的情況,該現有技術可能會對用戶的正常輸入產生影響。例如,某用 戶輸入的一個拼音序列中包含人名拼音串(如renmingzhong),于是該現有技 術將人名拼音串對應的人名候選項(如任明忠、任銘忠、任明中等)全部展現 給用戶,甚至還可能將這些人名候選項排列在普通詞條候選項的前面;但是實 際上該用戶真正想輸入的并不是一個人名,而是“人名中”這樣一個普通詞條, 此時,展現出的人名候選項顯然會造成用戶的反感。
發明內容
有鑒于此,本發明的目的在于提供一種字符輸入過程中展現候選項的方法 及裝置,以解決現有技術在展現人名候選項時可能會影響用戶正常輸入的問 題。
為實現上述目的,本發明提供了如下方案:
一種字符輸入過程中展現候選項的方法,包括:
接收用戶輸入的編碼字符串;
為所述編碼字符串生成候選項,所述候選項包括人名候選項以及根據普通 輸入法詞庫和/或智能組詞生成的普通詞條候選項;通過對所述人名候選項及 普通詞條候選項進行分析,來推斷用戶實際進行人名輸入的概率;
根據所述用戶實際進行人名輸入的概率展現所述候選項;
所述通過對所述人名候選項及普通詞條候選項進行分析來推斷用戶實際 進行人名輸入的概率包括:
分別將普通詞條候選項和人名候選項組成集合,根據普通詞條候選項集合 與人名候選項集合的包含關系來推斷用戶實際進行人名輸入的概率;或,
通過比較普通候選項的詞頻與人名候選項的人名組合概率的方法來推斷 用戶實際進行人名輸入的概率。
優選的,根據預置的人名用字概率表生成所述人名候選項。
優選的,所述分別將普通詞條候選項和人名候選項組成集合,根據普通詞 條候選項集合與人名候選項集合的包含關系來推斷用戶實際進行人名輸入的 概率包括:
提取所述普通詞條候選項組成的第一集合與所述人名候選項組成的第二 集合的交集;
根據所述交集的特征信息來推斷用戶實際進行人名輸入的概率。
優選的:
所述交集的特征信息為:所述交集為非空集合,且與所述普通詞條候選項 組成的第一集合相等,所述根據所述推斷的概率展現所述候選項具體為:展現 所述人名候選項。
優選的,所述展現所述人名候選項包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京搜狗科技發展有限公司,未經北京搜狗科技發展有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200810238915.0/2.html,轉載請聲明來源鉆瓜專利網。





