[發明專利]一種中文拼音輸入方法及系統有效
| 申請號: | 200710073720.0 | 申請日: | 2007-03-28 |
| 公開(公告)號: | CN101192108A | 公開(公告)日: | 2008-06-04 |
| 發明(設計)人: | 李偉杰 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F3/023 | 分類號: | G06F3/023;G06F17/27;G06F17/30 |
| 代理公司: | 深圳市順天達專利商標代理有限公司 | 代理人: | 郭偉剛;蔡曉紅 |
| 地址: | 518057廣東省深圳市高新科*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 中文 拼音輸入 方法 系統 | ||
技術領域
本發明涉及中文信息處理領域,更具體地說,涉及一種中文拼音輸入方法及系統。
背景技術
現在已涌現出多種漢字輸入方法,而以拼音為應用基礎的中文拼音輸入法是其中最普遍、最易掌握的一種。
中文拼音輸入法主要包括全拼輸入及簡拼輸入。當用戶要輸入詞組時,若采用全拼輸入,須鍵入正確完整的聲母和韻母的組合,若采用簡拼輸入,可不鍵入韻母,但須鍵入正確完整的聲母的組合。若詞組中的某個或某幾個聲母不正確,就不能獲得正確的結果,無法滿足用戶的需要。
隨著智能輸入技術的飛躍發展,智能化的拼音輸入法已經得到了廣泛的應用,用戶追求更便捷的功能選項,而模糊音輸入法也應運而生。該方法基于如附圖1所示的中文拼音輸入系統,該系統包括輸入單元100、拼音切分單元200、模糊音處理單元300、漢字匹配單元400、中文詞庫500以及輸出單元600。該系統實現模糊匹配的過程,通過一個簡單的示例闡述如下:(1)首先利用拼音切分單元200對輸入單元100中輸入的拼音進行切分,例如用戶輸入的拼音是:siwuqianli,那么拼音切分結果是:si’wu’qian’li;(2)利用模糊音處理單元300對拼音切分結果中的“si”這個音節進行模糊處理,得到:si,shi;(3)漢字匹配單元400根據模糊處理后的結果,從中文詞庫500中搜索對應的中文詞組,得到:史無前例,并將該詞組顯示到候選框中;(4)用戶選定后,則利用輸出單元600輸出該詞組。
由上可知,在該現有的模糊音輸入法中,其對音節進行的模糊處理實質上是對近似拼音的擴展,因此其準確性依賴于用戶輸入內容,智能化程度比較低。當出現非常生僻的字,用戶無法準確把握其拼音時,則無法獲得用戶期望的結果,要么無法輸出,要么輸出錯誤,無法保證輸出結果的準確性;而且,用戶若多次試驗以尋找正確詞組又會浪費大量時間,導致效率低下。
因此需要一種新的具有較強智能性的中文拼音輸入方法,當用戶輸入的中文拼音中有一個或者多個字的拼音不確定時,也能夠根據該拼音快速輸出準確的中文詞組。
發明內容
本發明的目的在于提供一種中文拼音輸入系統,旨在解決現有技術進行中文拼音輸入時智能性不足、當用戶輸入的中文拼音中存在一個或者多個字的拼音不確定時無法保證輸出的效率和準確性的問題。
本發明的目的還在于提供一種中文拼音輸入方法,以更好地解決現有技術中存在的上述問題。
為了實現發明目的,所述中文拼音輸入系統包括用于輸入中文拼音的輸入單元、用于對所述中文拼音進行切分的拼音切分單元、用于存儲中文數據的中文詞庫、用于將拼音切分結果與中文詞庫中搜索到的詞組相匹配的漢字匹配單元,以及用于輸出與拼音切分結果相匹配的詞組的輸出單元,所述系統還包括一個通配映射單元;
所述通配映射單元與拼音切分單元及漢字匹配單元相連,用于將包含通配符的拼音切分結果映射到所有與其對應的拼音組合,并將所述拼音組合送入漢字匹配單元。
優選地,所述拼音切分單元采用貪婪算法或動態規劃算法對所輸入的中文拼音進行切分處理。
優選地,所述通配映射單元用于通過遍歷機制,或者索引機制,或者建立詞表的方式,將拼音切分結果映射到所有與其對應的拼音組合。
優選地,所述漢字匹配單元用于建立一個包括搜索到的所有詞組的臨時數據表,并將所述臨時數據表中的詞組按順序顯示到候選框中供用戶選擇。
為了更好地實現發明目的,所述中文拼音輸入方法包括以下步驟:
A.對輸入的包含通配符的中文拼音進行切分處理;
B.通過所述通配符,將拼音切分結果映射到所有與其對應的拼音組合;
C.從中文詞庫中搜索與各拼音組合相匹配的中文詞組,并將搜索結果顯示到候選框中;
D.根據用戶對候選框中搜索結果的選擇,輸出中文詞組。
優選地,所述步驟A中的通配符包括字母、數字、符號中的任一者或組合。
優選地,所述步驟A中進行切分處理的步驟包括,采用貪婪算法或動態規劃算法對中文拼音進行切分處理。
優選地,所述步驟B進一步包括:
通過遍歷機制,或者索引機制,或者建立詞表的方式,將拼音切分結果映射到所有與其對應的拼音組合。
優選地,所述步驟C中將搜索結果顯示到候選框中的步驟進一步包括:
建立一個包括搜索到的所有詞組的臨時數據表,并將所述臨時數據表中的詞組按順序顯示到候選框中。
優選地,所述順序包括:漢字拼音中的字母排列順序,或者漢字的比劃數順序,或者漢字的詞頻順序。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200710073720.0/2.html,轉載請聲明來源鉆瓜專利網。





