[發明專利]一種名詞輸入的方法及系統有效
| 申請號: | 201010197817.4 | 申請日: | 2010-06-03 |
| 公開(公告)號: | CN102270048A | 公開(公告)日: | 2011-12-07 |
| 發明(設計)人: | 楊磊;查文;王天一 | 申請(專利權)人: | 北京搜狗科技發展有限公司 |
| 主分類號: | G06F3/023 | 分類號: | G06F3/023 |
| 代理公司: | 北京潤澤恒知識產權代理有限公司 11319 | 代理人: | 蘇培華 |
| 地址: | 100084 北京市海淀區中關*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 名詞 輸入 方法 系統 | ||
技術領域
本發明涉及輸入法技術領域,特別是涉及一種名詞輸入的方法及系統。
背景技術
在輸入法領域,進行中文輸入的過程中,詞庫在很大程度上影響著從拼音向漢字(詞)轉換的準確率,從而進一步影響用戶的輸入效率。但是,對于人名、地名、公司名、物品名等各種名詞的輸入,由于不同用戶所使用詞條的差異性,以及各種名詞變形形式的復雜性,導致與各種名詞相關的詞條很難通過詞庫來解決。
以人名輸入為例,對于同一個名字,實際使用中會有各種不同形式的稱謂。例如,對于名字“李江濤”,通常在正式的場合中才會使用“李江濤”全名,在各種其他場合,可能用到“江濤”、“濤哥”、“李哥”、“小李”、“老李”、“阿濤”等等稱謂,還有可能出現“李總”、“李工”、“李經理”、“李老師”、“李同志”、“李同學”等形式的稱謂。由于人名極具個性化,而且不同用戶可能用到的人名以及稱謂各不相同,因此在中文輸入法中需要解決人名(或稱謂)輸入的問題。
目前常用的解決方法有兩種:
一種是使用用戶詞庫,目前大多數輸入法都具有造詞和調頻的能力,即能夠記錄用戶首次使用的新詞,并根據用戶的歷史使用情況對詞條的詞頻進行調整。特別的,對于人名及稱謂,在首次使用時會被記錄下來并進入用戶詞庫,使得用戶的后續使用能夠非常方便。
另一種是導入人名庫,即通過各種途徑獲得用戶所能用到的人名庫,并導入到輸入法中,以便用戶輸入時直接從庫中獲取。其中,人名庫的獲取途徑可以是直接的人工編輯,也可以定期通過網絡更新,還可以通過其他來源獲取。
但是,上述兩種解決方法各自都存在缺陷,從而限制了用戶輸入效率的進一步提高。其中,用戶詞庫雖然能夠很好地解決第二次以及后續輸入的問題,但是,首次輸入仍然通過手工造詞實現(所述首次輸入主要指各種不同稱謂的詞的首次輸入)。而導入人名庫雖然能夠解決人名相關的首次輸入問題,但是,由于稱謂的使用與用戶的用詞習慣、用詞環境密切相關,不同用戶使用的稱謂也各不相同,因此難以通過導入人名庫的方式對所有用戶使用的稱謂進行窮舉。
同樣,對于地名、公司名、物品名等各種名詞的輸入,也存在著與人名輸入類似的問題。
發明內容
本發明所要解決的技術問題是提供一種名詞輸入的方法及系統,能夠進一步提高用戶輸入名詞的效率。
為了解決上述問題,本發明公開了一種名詞輸入的方法,包括:
通過預定方式獲取名詞;
對所述名詞按照預定規則進行拆分和/或變形擴展,生成基于該名詞的衍生詞條;
利用所述衍生詞條對輸入法的輸出候選項進行調整。
其中,所述名詞為人名,則所述預定規則為人名規則。
其中,所述名詞為地名,則所述預定規則為地名規則。
其中,所述名詞為可縮寫或簡稱的名詞,則所述預定規則為縮寫或簡稱規則。
其中,對所述人名按照人名規則進行拆分包括:按照“姓表”對人名進行姓和名的拆分,所述“姓表”中包括單姓和復姓。
其中,對所述人名按照人名規則進行拆分包括:根據人名中各漢字的位置以及漢字本身構成人名的可能性來判斷人名中的漢字是姓還是名,進行姓和名的拆分。
其中,對所述人名按照人名規則進行變形擴展包括:對人名拆分后的姓和/或名分別加上附加部分,所述附加部分是通過分析用戶對特定稱謂的偏好,將所述特定稱謂作為附加部分;其中,通過以下方式分析用戶對特定稱謂的偏好:通過分析用戶的詞條使用情況;和/或,根據用戶的注冊信息;和/或,根據定位信息或網絡地址信息;和/或,根據通訊錄中記錄的與姓名相關的附屬信息,所述附屬信息包括職位、性別或年齡信息。
其中,對所述地名按照地名規則進行拆分包括:根據標識地名信息的特定詞庫,從所述地名中查找包含在該特定詞庫中的詞條,并依據該詞條對地名進行拆分。
其中,對所述地名按照地名規則進行變形擴展包括:對地名拆分后的部分詞條加上附加部分;和/或,直接對所述地名加上附加部分。
其中,對所述可縮寫或簡稱的名詞按照縮寫或簡稱規則進行拆分包括:所述可縮寫或簡稱的名詞為公司名,則根據標識公司信息的特定詞庫,從所述公司名中查找包含在該特定詞庫中的詞條,并依據該詞條對公司名進行拆分;所述可縮寫或簡稱的名詞為產品名,則根據標識產品信息的特定詞庫,從所述產品名中查找包含在該特定詞庫中的詞條,并依據該詞條對產品名進行拆分;所述可縮寫或簡稱的名詞為物品名,則根據標識物品信息的特定詞庫,從所述物品名中查找包含在該特定詞庫中的詞條,并依據該詞條對物品名進行拆分。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京搜狗科技發展有限公司,未經北京搜狗科技發展有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010197817.4/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:汽車電池箱快速定位浮動連接器
- 下一篇:用于電纜連接器的固線螺母





