[發明專利]一種輸入方法及系統在審
| 申請號: | 201410104464.7 | 申請日: | 2014-03-19 |
| 公開(公告)號: | CN103885608A | 公開(公告)日: | 2014-06-25 |
| 發明(設計)人: | 黃藝華 | 申請(專利權)人: | 百度在線網絡技術(北京)有限公司 |
| 主分類號: | G06F3/023 | 分類號: | G06F3/023;G06F17/27 |
| 代理公司: | 北京鴻德海業知識產權代理事務所(普通合伙) 11412 | 代理人: | 袁媛 |
| 地址: | 100085 北京*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 輸入 方法 系統 | ||
【技術領域】
本發明涉及輸入法技術領域,尤其涉及一種輸入方法及系統。
【背景技術】
日文輸入法中通常會存在日文和英文混合輸入的情況,即用戶輸入的英文字符串中,包含假名字符對應的英文字符和英文詞條對應的英文字符,因此需要依據輸入的英文字符串進行處理,以識別出英文字符串中的英文詞條和假名字符。
目前,日文輸入法中對英文字符串進行處理的方法是:從英文字符串的第一個英文字符開始,利用從左到右正向匹配算法,將英文字符串進行切分,獲得切分結果,然后依次在輸入法詞典中進行匹配,如果依據切分結果匹配出一個假名字符,則判斷切分結果為假名字符;如果切分結果匹配不出假名字符,則判斷該切分結果為英文字符。
然而,當輸入的英文字符串中包含日文和英文時,由于優先獲得英文字符串對應的假名字符,因此,將丟失英文詞匯的候選詞條,從而無法獲得有效地候選詞條,導致顯示框中顯示的候選詞條的準確性較低。
【發明內容】
有鑒于此,本發明實施例提供了一種輸入方法及系統,可以實現提高候選顯示框中顯示的候選詞條的準確性。
本發明實施例提供了一種輸入方法,包括:
接收輸入的至少兩個英文字符;
依據所述至少兩個英文字符,獲得基于第一語言的第一候選詞條;
依據所述至少兩個英文字符,獲得基于第二語言的第二候選詞條;
依據所述第一候選詞條和所述第二候選詞條,獲得第三候選詞條。
上述方法中,所述基于第一語言的第一候選詞條為英文詞條,所述基于第二語言的第二候選詞條為假名詞條;或者,
所述基于第一語言的第一候選詞條為英文詞條,所述基于第二語言的第二候選詞條為漢字詞條。
上述方法中,所述依據所述至少兩個英文字符,獲得基于第一語言的第一候選詞條,包括:
對所述至少兩個英文字符進行切分處理,以獲得切分結果;
獲得所述切分結果的概率信息,所述概率信息指示所述切分結果是基于第一語言的候選詞條的概率;
將大于預設的概率閾值的概率信息所對應的切分結果作為所述基于第一語言的第一候選詞條。
上述方法中,所述基于第一語言的第一候選詞條為英文詞條,所述基于第二語言的第二候選詞條為假名詞條,所述獲得所述切分結果的概率信息,包括:
利用如下公式獲得所述切分結果的概率信息P(E|c):
P(E|c)=P(E)P(c|E)/(P(J)|P(c|J)+P(E)P(c|E))
其中,P(E)為切分結果c是英文單詞的先驗概率,P(c|E)為英文詞匯中出現切分結果c的條件概率,P(J)為切分結果c是假名字符的先驗概率,P(c|J)為假名字符對應的英文字符串中出現切分結果c的條件概率。
上述方法中,所述依據所述第一候選詞條和所述第二候選詞條,獲得第三候選詞條,包括:
獲得所述第一候選詞條在輸入的至少兩個英文字符中的第一位置信息;
獲得所述第二候選詞條對應的英文字符串在輸入的至少兩個英文字符中的第二位置信息;
依據所述基于第一語言的第一候選詞條、所述第一位置信息、所述基于第二語言的第二候選詞條和所述第二位置信息,獲得所述第三候選詞條。
本發明實施例還提供了一種輸入系統,包括:
輸入單元,用于接收輸入的至少兩個英文字符;
詞條處理單元,用于依據所述至少兩個英文字符,獲得基于第一語言的第一候選詞條;依據所述至少兩個英文字符,獲得基于第二語言的第二候選詞條;依據所述第一候選詞條和所述第二候選詞條,獲得第三候選詞條。
上述系統中,所述基于第一語言的第一候選詞條為英文詞條,所述基于第二語言的第二候選詞條為假名詞條;或者,
所述基于第一語言的第一候選詞條為英文詞條,所述基于第二語言的第二候選詞條為漢字詞條。
上述系統中,所述詞條處理單元具體用于:
對所述至少兩個英文字符進行切分處理,以獲得切分結果;
獲得所述切分結果的概率信息,所述概率信息指示所述切分結果是基于第一語言的候選詞條的概率;
將大于預設的概率閾值的概率信息所對應的切分結果作為所述基于第一語言的第一候選詞條。
上述系統中,所述基于第一語言的第一候選詞條為英文詞條,所述詞條處理單元具體用于:
利用如下公式獲得所述切分結果的概率信息P(E|c):
P(E|c)=P(E)P(c|E)/(P(J)|P(c|J)+P(E)P(c|E))
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于百度在線網絡技術(北京)有限公司,未經百度在線網絡技術(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410104464.7/2.html,轉載請聲明來源鉆瓜專利網。





