[發明專利]一種基于漢字輸入法下的造詞方法和漢字輸入設備有效
| 申請號: | 200910188580.0 | 申請日: | 2009-12-02 |
| 公開(公告)號: | CN101719018A | 公開(公告)日: | 2010-06-02 |
| 發明(設計)人: | 張靖 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F3/023 | 分類號: | G06F3/023;G06F9/44 |
| 代理公司: | 廣州三環專利代理有限公司 44202 | 代理人: | 郝傳鑫;潘中毅 |
| 地址: | 518057 廣東省深圳市高*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 漢字輸入法 造詞 方法 漢字輸入 設備 | ||
技術領域
本發明涉及信息處理技術,尤其涉及一種基于漢字輸入法下的造詞方法和 漢字輸入設備。
背景技術
用戶將漢字輸入到電腦,需要借助于漢字輸入軟件,漢字輸入軟件為運行 于操作系統上的一個工具軟件,把鍵盤輸入的編碼或其他非鍵盤輸入的媒體數 據轉換成漢字輸入的軟件。鍵盤漢字輸入軟件就是利用鍵盤,根據一定的編碼 規則來輸入漢字的一種方法。
現有的漢字編碼方案已經有數百種,其中在電腦上已經運行的就有幾十種, 作為一種圖形文字,漢字是由字的音、形、義來共同表達的,漢字輸入的編碼 方法,基本上都是采用將音、形、義與特定的鍵相聯系,再根據不同漢字進行 組合來完成漢字的輸入的。
人們在使用現有漢字輸入法的過程中,經常需要輸入一些人名、復合詞之 類的詞語。而多數漢字輸入法自帶的核心詞庫不能很好地覆蓋這類詞語,使得 人們在需要輸入這類詞語時,只能拆分開按單純詞進行輸入,影響了輸入體驗。
比如現有的極點五筆、萬能五筆、智能陳橋、搜狗五筆等五筆輸入法已經 實現了智能造詞的功能,即在用戶輸入過程中,將用戶連續輸入的字組合成詞。 雖然目前幾種主流五筆輸入法中都已經實現了智能造詞的功能,但它們的規則 還比較簡單:該漢字輸入法下的造詞規則僅限于單字,只能將連續輸入的單字 組合成詞,不能將詞語與詞語組合成新詞,即只能實現A+B=AB,不能實現 AB+CD=ABCD;對連續輸入沒有限制,例如連續輸入“工”、“要”、“在”、“地”、 “一”,就能組出“工要在地一”,這樣非常容易產生垃圾詞;輸入法中的造詞 規則過于繁瑣,難以實現,例如將兩個字組合成詞,需要將這兩個字連續輸入, 并且重復兩遍。而如果只是一次輸入,并不能將它們組合成詞。如:樂+扣+ 樂+扣,才能造出“樂扣”這個新詞。
發明內容
鑒于上述現有技術所存在的問題,本發明實施例提供了一種基于漢字輸入 法下的造詞方法及漢字輸入設備,通過對用戶輸入的字詞進行相應的詞法分析, 方便用戶組合出新的輸入詞語。
為了解決上述技術問題,本發明實施例提供了一種基于漢字輸入法下的造 詞方法,包括:
提取用戶在按鍵輸入過程中輸入的選詞隊列,判斷所述選詞隊列是否包括 至少兩個基本輸入選詞,如果存在至少兩個基本輸入選詞時,則提取所述選詞 隊列,基于漢字輸入法已有詞庫分析所述選詞隊列中基本輸入選詞的詞型類別, 所述詞型類別為單字、或者包含多個字的詞;所述選詞隊列至少包括兩個基本 輸入選詞,所述基本輸入選詞為漢字輸入法系統詞庫中的已記錄的詞或者字;
判斷所述選詞隊列是否符合預先設置的造詞約束規則,所述造詞約束規則 為:選詞隊列的字數不超過第一預設值,且選詞隊列中的基本輸入選詞的字數 不超過第二預設值以及選詞隊列中的詞數不超過第三預設值;進一步,所述造 詞約束規則為:對輸入選詞為單字和單字組合的選詞隊列情況下,選詞隊列中 包含的字數不超過三個字,且不允許三字重復為同一字;對輸入選詞為單字和 詞組合的選詞隊列情況下,單字不屬于詞中的字;對輸入選詞為詞和詞組合的 選詞隊列情況下,每個詞所包含的字不超過三個,且只允許兩個已有詞組合造 詞;
對滿足造詞約束規則的選詞隊列按照漢字輸入法規則為新詞匹配所對應的 按鍵輸入信息。
所述方法之前還包括:
預先緩存用戶每次按鍵過程中輸入的選詞隊列;或者實時本地存儲用戶每 次按鍵輸入過程中輸入的選詞隊列。
所述對滿足造詞約束規則的選詞隊列按照漢字輸入法為新詞匹配所對應的 按鍵輸入信息之前還包括:
判斷所述滿足造詞約束規則的選詞隊列是否為漢字輸入法系統詞庫中的已 有詞;
在判斷出所述滿足造詞約束規則的選詞隊列不是漢字輸入法系統詞庫中的 已有詞時,對滿足造詞約束規則的選詞隊列按照漢字輸入法為新詞匹配所對應 的按鍵輸入信息。
所述方法還包括:
對滿足造詞約束規則的選詞隊列存儲在漢字輸入法的詞庫中。
相應的,本發明實施例還提供了一種漢字輸入設備,包括:
獲取模塊,用于提取用戶按鍵過程中輸入的選詞隊列,所述選詞隊列至少 包括兩個基本輸入選詞,所述基本輸入選詞為漢字輸入法系統詞庫中的已記錄 的詞或者字;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200910188580.0/2.html,轉載請聲明來源鉆瓜專利網。





