[發明專利]一種輸入方法、裝置和用于輸入的裝置有效
| 申請號: | 201610350134.5 | 申請日: | 2016-05-24 |
| 公開(公告)號: | CN107422872B | 公開(公告)日: | 2021-11-30 |
| 發明(設計)人: | 崔欣;張揚 | 申請(專利權)人: | 北京搜狗科技發展有限公司 |
| 主分類號: | G06F3/023 | 分類號: | G06F3/023 |
| 代理公司: | 北京潤澤恒知識產權代理有限公司 11319 | 代理人: | 劉祥景 |
| 地址: | 100084 北京市海淀區中關*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 輸入 方法 裝置 用于 | ||
本發明實施例提供了一種輸入方法、裝置和用于輸入的裝置,其中的輸入方法具體包括:獲取輸入串對應的第一向量序列;依據預置的多元關系計算規則,計算得到所述第一向量序列對應的第一多元關系得分;依據所述第一多元關系得分,確定所述輸入串對應的候選項。本發明實施例可以存儲用于獲得上述第一向量序列的向量,而可以不存儲大于等于2的所有的多元關系,因此可以節省大量的存儲空間。
技術領域
本發明涉及輸入法技術領域,特別是涉及一種輸入方法、裝置和用于輸入的裝置。
背景技術
對于中文、日文、韓文等用戶而言,一般都需要通過輸入法系統與計算機進行交互。例如,用戶可以通過鍵盤鍵入輸入串,然后由輸入法系統依據其預置的標準映射規則將該輸入串轉換為相應語言的候選項并展示,進而將用戶選擇的候選項上屏。
隨著輸入法技術的不斷發展,以及對輸入體驗的不斷提升,用戶對于輸入長詞或者句子的需求也在增加,例如輸入長詞:“海邊抓螃蟹”、“公積金天天降”、“美利堅合眾國德州”、“今天天氣真是陽光明媚”等。為了滿足用戶對于上述長詞或者句子的輸入需求,按照傳統的n-gram(n元關系)存儲方式,系統詞庫中需要存儲“海邊|抓|螃蟹”這樣的三元組或者多元組。
然而,在實際應用中,當n元關系大于等于3時,所需要存儲的多元關系將以幾何的倍數增長,對于內存有限的輸入設備,如手機、平板電腦等顯然不能滿足對n-gram存儲結構的完整存儲,因此,系統詞庫通常采用n-gram中的2元關系。可以看出,現有的n-gram存儲方式在存儲空間有限的情況下,無法滿足對多元關系的需求。
發明內容
鑒于上述問題,提出了本發明實施例以便提供一種克服上述問題或者至少部分地解決上述問題的輸入方法、裝置和用于輸入的裝置,能夠簡化數學表達式的輸入過程,提高輸入效率。
為了解決上述問題,本發明實施例公開了一種輸入方法,包括:
獲取輸入串對應的第一向量序列;
依據預置的多元關系計算規則,計算得到所述第一向量序列對應的第一多元關系得分;
依據所述第一多元關系得分,確定所述輸入串對應的候選項。
可選地,所述獲取輸入串對應的第一向量序列的步驟,包括:
依據元詞對用戶的輸入串進行切分,以得到第一字符切分結果;
獲取所述第一字符切分結果對應的第一元詞序列;
查詢已建立的詞向量庫,獲取所述第一元詞序列中各元詞對應的向量;
對所述第一元詞序列中各元詞對應的向量依次串接,得到所述輸入串對應的第一向量序列。
可選地,通過如下步驟建立所述詞向量庫:
獲取詞庫中元詞對應的元詞號;
對所述詞庫中的元詞生成對應的向量;
依據所述元詞號與所述向量之間的映射關系,建立詞向量庫。
可選地,所述方法還包括:
獲取所述輸入串對應的系統詞序列;
確定所述系統詞序列對應的第二多元關系得分;
則所述依據所述第一多元關系得分,確定所述輸入串對應的候選項的步驟,包括:
依據所述第一多元關系得分以及第二多元關系得分的排序,確定所述輸入串對應的候選項。
可選地,所述獲取所述輸入串對應的系統詞序列的步驟,包括:
依據系統詞對所述輸入串進行切分,以得到第二字符切分結果;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京搜狗科技發展有限公司,未經北京搜狗科技發展有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610350134.5/2.html,轉載請聲明來源鉆瓜專利網。





