[發明專利]一種中文詞庫更新系統及方法有效
| 申請號: | 200610061369.9 | 申請日: | 2006-06-26 |
| 公開(公告)號: | CN101079037A | 公開(公告)日: | 2007-11-28 |
| 發明(設計)人: | 余祥鑫;張會鵬 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 深圳市順天達專利商標代理有限公司 | 代理人: | 郭偉剛;蔡曉紅 |
| 地址: | 518057廣東省深圳市高新科*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 中文 詞庫 更新 系統 方法 | ||
技術領域
本發明涉及計算機技術領域,更具體地說,涉及一種中文詞庫更新系統及方法。
背景技術
在通過計算機等輸入設備進行中文輸入時,通常要使用到中文輸入系統。中文輸入系統為運行于操作系統上的一個工具軟件,其用于把鍵盤輸入的編碼或其他非鍵盤輸入的媒體數據轉換成漢字輸入。目前,中文輸入系統可分為鍵盤輸入和非鍵盤輸入,而使用最廣的就是基于鍵盤的中文輸入軟件。
鍵盤中文輸入系統為利用鍵盤并根據一定的編碼規則來輸入漢字的軟件。由于鍵盤上的按鍵個數有限,而漢字的字數有幾萬個,因此必須對漢字進行編碼,并將這些編碼與鍵盤上的鍵聯系起來,從而可通過鍵盤輸入某個漢字的編碼,然后根據編碼轉換成漢字。目前,漢字的輸入通常采用將漢字的音、形或義與特定的鍵相聯系,再進行組合來完成漢字的輸入。而非鍵盤中文輸入系統則包括手寫輸入系統、語音輸入系統、OCR輸入系統等。
現在中文輸入系統還具有學習功能,可以學習用戶輸入的詞或短語,即在第一次輸入某一詞或短語后,第二次輸入相同的詞或短語時,只需輸入第一個字即可自動顯示后續的字,或者通過簡寫的代碼即可顯示該詞或短語,從而方便了輸入。
如圖1所示,一般中文輸入系統包括有用戶接口(User?Interface)模塊11、備選詞查詢模塊12、核心詞典13、用戶詞典14以及自學習模塊15。其中用戶接口11模塊完成中文輸入系統與用戶的交互,獲取用戶輸入的拼音或其他編碼;備選詞查詢模塊12根據查詢算法檢索核心詞典13和用戶詞典14,獲取最可能的一序列備選字、詞或短語;核心詞典13是由系統提供的詞庫,在輸入系統安裝完成后該詞典不會改變;用戶詞典14是用戶自己定義的字、詞或短語,或者在使用過程中系統自學習用戶輸入生成的詞、短語組成的詞庫,隨用戶使用過程不斷增加;自學習模塊15用于學習用戶輸入的詞或短語,并把核心詞典和用戶詞典沒有的詞、短語加入到用戶詞典。
然而,上述中文輸入系統的用戶詞典都存儲在本地存儲裝置,如果在某臺輸入設備使用中文輸入系統生成的詞并加入到用戶詞典,然后在另一輸入設備使用相同的中文輸入系統輸入相同的詞時,必須重新定義這個詞,并加入到當前輸入設備的中文輸入系統的用戶詞典。即用戶需在其使用的所有輸入設備中分別定義相同的用戶詞,生成用戶詞典,極為不便。另外當用戶重新安裝中文輸入系統時,用戶詞典往往會丟失,導致用戶以前自定義的或曾經自學習得到的詞或短語丟失,需要重新定義這些詞或短語。
發明內容
本發明要解決的技術問題在于,針對上述在不同終端進行中文詞組或短語輸入時無法共享用戶詞典的問題,提供一種中文詞庫更新系統及方法。
本發明解決上述技術問題的技術方案是,提供一種中文詞庫更新系統,所述中文詞庫與中文輸入模塊連接并包括有位于終端設備的核心詞典和用戶詞典,還包括位于所述終端設備并通過網絡連接到服務器的同步模塊,所述服務器用于保存與用戶詞典對應的用戶帳號的詞典數據,所述同步模塊使所述用戶詞典與服務器中對應用戶帳號的詞典數據之間保持同步。
在本發明所述的一種中文詞庫更新系統中,所述服務器包括有存儲詞典數據的用戶數據庫以及建立和維護所述用戶數據庫中詞典數據的網絡詞典模塊,所述網絡詞典模塊分別與同步模塊和用戶數據庫連接。
在本發明所述的一種中文詞庫更新系統中,所述網絡詞典模塊根據用戶帳號對用戶數據庫中的多個不同用戶的詞典數據進行維護。
在本發明所述的一種中文詞庫更新系統中,所述同步模塊通過定時器定時執行用戶詞典與用戶數據庫中對應用戶帳號的詞典數據的同步操作,或者在啟動或關閉中文輸入模塊時執行同步操作。
在本發明所述的一種中文詞庫更新系統中,所述同步模塊在進行用戶詞典與詞典數據同步時,若用戶詞典的更新時間早于服務器中對應用戶帳號的詞典數據的更新時間,則根據所述詞典數據更新用戶詞典;若詞典數據的更新時間早于用戶詞典的更新時間,則根據所述用戶詞典更新服務器中的詞典數據。
在本發明所述的一種中文詞庫更新系統中,所述同步模塊使用更新序列號參數實現最新數據判斷,網絡詞典模塊在客戶端請求更新一次詞典數據的同時使詞典數據的更新序列號加1,并在更新時通過更新序列號的值來選擇數據進行更新。
本發明還提供一種中文詞庫更新方法,所述中文詞庫與中文輸入模塊連接并包括有位于終端設備的核心詞典和用戶詞典,包括以下步驟:
(a)所述用戶詞典根據中文輸入模塊的輸入存儲中文詞組或短語;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200610061369.9/2.html,轉載請聲明來源鉆瓜專利網。





