[發(fā)明專利]一種帶有容錯能力的中文內容拼寫校正系統(tǒng)及方法無效
| 申請?zhí)枺?/td> | 201110339934.4 | 申請日: | 2011-11-01 |
| 公開(公告)號: | CN102368271A | 公開(公告)日: | 2012-03-07 |
| 發(fā)明(設計)人: | 陳淮琰;陳國強 | 申請(專利權)人: | 無敵科技(西安)有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06F3/023 |
| 代理公司: | 西安智邦專利商標代理有限公司 61211 | 代理人: | 商宇科 |
| 地址: | 710075 陜西省*** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 帶有 容錯 能力 中文 內容 拼寫 校正 系統(tǒng) 方法 | ||
技術領域
本發(fā)明涉及一種校正中文內容的方法,尤其涉及一種帶有容錯能力的中文內容拼寫校正系統(tǒng)及方法。
背景技術
現在有中文查詢或輸入的畫面的電子辭典、PDA、PC等電子產品非常多,也被很多的用戶使用,但是對于查詢或輸入中文內容時,因為有字念錯,例如:想輸入“吹毛求疵(chuimaoqiuci)”,卻輸入成“吹毛球比(chuimaoqiubi)”,但在現有技術中就無法由“吹毛球比”查詢或匹配到用戶實際想輸入的“吹毛求疵”上,具有很大局限性。
發(fā)明內容
為了解決背景技術中所存在的技術問題,本發(fā)明提出了一種帶有容錯能力的中文內容拼寫校正系統(tǒng)及方法,適用范圍廣泛,實用性強。
本發(fā)明的技術解決方案是:一種帶有容錯能力的中文內容拼寫校正系統(tǒng),其特殊之處在于:所述系統(tǒng)包括獲取拼音或中文內容的獲取模塊、進行對照查找的查找模塊、儲存對照表信息的儲存模塊、判斷匹配信息的處理模塊以及輸出匹配內容的輸出模塊;所述獲取模塊與查找模塊連接,所述處理模塊與查找模塊連接,所述輸出模塊與處理模塊連接,所述儲存模塊與查找模塊連接。
上述系統(tǒng)還包括將中文內容進行轉換的轉換模塊,所述轉換模塊與獲取模塊連接。
上述儲存模塊包括缺省的常用字詞組合的拼音資料庫、常用字詞組合的拼音漢字對照表以及相應的漢字與其拼音序列對照的數據庫。
一種帶有容錯能力的中文內容拼寫校正方法,其特殊之處在于:所述方法包括以下步驟:
1)建立缺省的常用字詞組合的拼音資料庫;
2)建立常用字詞組合的拼音漢字對照表;
5)獲取拼音序列;
6)根據常用字詞組合的拼音漢字對照表查詢與獲取的拼音序列相匹配的字詞;
7)判斷是否匹配到符合要求的字詞,若是,進行步驟6);
8)輸出匹配的字詞。
上述步驟7)若沒有匹配到符合要求的字詞,則進行步驟7.1)省略部分字拼音后在缺省的常用字詞組合的拼音資料庫中查找相匹配的字詞。
上述步驟2)之后還包括步驟3)建立相應的漢字與其拼音序列對照的數據庫。
上述步驟3)之后還包括步驟4)得到中文內容,根據相應的漢字與其拼音序列對照的數據庫得到與中文內容對應的拼音序列。
本發(fā)明是一種根據漢字拼音拼寫組合及發(fā)音規(guī)則,結合常用字詞組合規(guī)則來校正中文內容的方法,用戶可以通過此方法來輸入或查詢更多的中文近音字匯,可以更為快捷和簡便需要學習字匯或需要查詢更多字匯的用戶。本發(fā)明可更大范圍的滿足用戶輸入或查詢字匯的需求,并且字匯的查詢和輸入具有擴展性和延伸性。
附圖說明
圖1是本發(fā)明的結構示意圖;
圖2為由輸入拼音序列得到拼寫校正內容的方法流程圖;
圖3為由中文內容得到拼寫校正內容的方法流程圖;
具體實施方式
參見圖1,本發(fā)明的帶有容錯能力的中文內容拼寫校正系統(tǒng),包括獲取拼音或中文內容的獲取模塊1、進行對照查找的查找模塊2、儲存對照表信息的儲存模塊3、判斷匹配信息的處理模塊4以及輸出匹配內容的輸出模塊5;獲取模塊與1查找模塊2連接,處理模塊4與查找模塊2連接,輸出模塊5與處理模塊4連接,儲存模塊3與查找模塊2連接;還包括將中文內容進行轉換的轉換模塊6,轉換模塊6與獲取模塊1連接;儲存模塊3包括缺省的常用字詞組合的拼音資料庫、常用字詞組合的拼音漢字對照表以及相應的漢字與其拼音序列對照的數據庫。
參見圖2,圖3,本發(fā)明的帶有容錯能力的中文內容拼寫校正方法,包括以下步驟:
1)建立缺省的常用字詞組合的拼音資料庫;
2)建立常用字詞組合的拼音漢字對照表;
3)建立相應的漢字與其拼音序列對照的數據庫;
4)得到中文內容,根據相應的漢字與其拼音序列對照的數據庫得到與中文內容對應的拼音序列;
5)獲取拼音序列;
6)根據常用字詞組合的拼音漢字對照表查詢與獲取的拼音序列相匹配的字詞;
7)判斷是否匹配到符合要求的字詞,若是,進行步驟6);若沒有匹配到符合要求的字詞,則進行步驟7.1)省略部分字拼音后在缺省的常用字詞組合的拼音資料庫中查找相匹配的字詞。
8)輸出匹配的字詞。
本發(fā)明的方法靈活性很高,如果用戶輸入的是拼音,則先直接在對照表中查找對應的字詞組合,如果沒有再在數據庫中查找;
如果是中文內容則先在數據庫中找到其中文所對應的拼音序列,再通過拼音替換表對所得到的拼音序列進行替換;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于無敵科技(西安)有限公司,未經無敵科技(西安)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110339934.4/2.html,轉載請聲明來源鉆瓜專利網。





