[發明專利]互聯網中文簡繁字轉換系統及方法在審
| 申請號: | 201310215166.0 | 申請日: | 2013-05-31 |
| 公開(公告)號: | CN103559178A | 公開(公告)日: | 2014-02-05 |
| 發明(設計)人: | 劉家豐;周思達;廖發源;譚茜霞;劉潤澤 | 申請(專利權)人: | 武漢中文百科網絡有限公司;北京四海書同文國際文化交流中心 |
| 主分類號: | G06F17/28 | 分類號: | G06F17/28 |
| 代理公司: | 北京華沛德權律師事務所 11302 | 代理人: | 劉麗君 |
| 地址: | 430035 湖北省武漢市*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 互聯網 中文 簡繁字 轉換 系統 方法 | ||
技術領域
本發明涉及中文簡繁轉換技術領域,特別涉及一種互聯網中文簡繁字轉換系統及方法。?
背景技術
中國大陸地區從上世紀60年代開始全面使用簡化字,而臺港澳地區以及海外華人華語社區依然使用繁體字。此外,中國大陸在古籍出版、古漢語教學研究以及某些對外交往中,仍然使用繁體字。漢字繁簡體并存這一客觀情況,對漢字的簡繁文本轉換提出了要求;同時由于海峽兩岸文化、經貿活動廣闊度、頻繁度的增加和交流程度的深入,兩岸民眾均對繁簡字的準確轉換提出了越來越迫切和更高級的要求。?
近十多年來,學術界和互聯網界都有不少專家、學者對繁簡字的轉換進行了研究和探索,研制了不少繁簡字轉換工具或轉換系統,但至今尚無一種能夠在中國“大陸簡化字”與“臺灣繁體字(有人稱正體字)”之間準確轉換的工具或系統。?
目前在互聯網上使用較為廣泛和較多的繁簡字轉換工具或轉換系統有:金山詞霸的“繁體字簡體字轉換”、google(谷歌)翻譯軟件中的“繁簡字轉換”以及百度搜索中的“繁簡字轉換”。以上三種繁簡字轉換工具或轉換系統,在實現“簡化字”與“繁體字”的轉換時,都只能部分地實現“簡化字”與“繁體字”的轉換,不能達到準確轉換的目的。?
發明內容
有鑒于此,本發明的目的在于提供一種互聯網中文簡繁字轉換系統及方法,用于實現“簡化字”與“繁體字”的準確轉換。?
本發明提供了一種互聯網中文簡繁字轉換系統,包括:?
分詞模塊,用于對輸入的語句進行分詞,不同的語義分出不同的字和詞組;?
符號處理模塊,用于對簡體語句與繁體語句中的不相同符號進行轉換;?
詞組處理模塊,用于對分詞后簡體的詞組進行繁體轉換;?
字處理模塊,用于將簡體字轉換為繁體字;?
綜合處理模塊,用于對簡體和繁體字詞在不同語境中的不同用法進行轉換。?
本發明還提供了一種互聯網中文簡繁字轉換方法,包括:?
將輸入的語句進行分詞,不同的語義分出不同的字和詞組;?
將簡體語句與繁體語句中的不相同符號進行轉換;?
對分詞后簡體的詞組進行繁體轉換;?
將簡體字轉換為繁體字;?
對簡體和繁體字詞在不同語境中的不同用法進行轉換。?
本發明實現了互聯網及計算機領域內繁簡詞匯的準確轉換,提供了準確的簡繁轉換工具。例如:?
應用程序接口(大陸簡體)—轉換—→應用程式介面(臺灣繁體)?
服務器(大陸簡體)—轉換—→伺服器(臺灣繁體)?
帶寬(大陸簡體)—轉換—→頻寬(臺灣繁體)?
云計算(大陸簡體)—轉換—→雲端運算(臺灣繁體)?
其次,本發明用技術手段實現了海峽兩岸民眾在互聯網上的交流,若大陸網站使用本系統,可以方便臺灣民眾閱覽,提高網站對臺灣民眾的親和力、親切感。?
最后,大陸地區的運營性網站運營本系統制作繁體版,方便臺灣地區民眾(在繁體版上)認讀、識別產品名稱,有利于交易的達成,因而也將有利于提升網站的市場競爭力。例如,在農產品名稱方面:?
菠蘿(大陸簡體)—轉換—→鳳梨(臺灣繁體)?
獼猴桃(大陸簡體)—轉換—→奇異果(臺灣繁體)?
番石榴(大陸簡體)—轉換—→芭樂(臺灣繁體)?
西蘭花(大陸簡體)—轉換—→花椰菜(臺灣繁體)?
附圖說明
圖1為本發明實施例提供的互聯網中文簡繁字轉換系統結構圖;?
圖2為本發明實施例中分詞模塊的結構圖;?
圖3為本發明實施例中“臺灣大學”網站首頁首屏截屏圖。?
具體實施方式
為使本發明的目的、技術方案和優點更加清楚,下面結合附圖對本發明作進一步的詳細描述。?
如圖1所示,本實施例提供的互聯網中文簡繁字轉換系統主要有五個模塊:符號處理模塊、詞組處理模塊、字處理模塊、綜合處理模塊以及分詞模塊。?
分詞模塊11,用于對輸入的語句進行分詞,不同的語義能分出不同的字和詞組。如圖2所示,分詞模塊11具體包括:?
語句分詞單元111、用于將語句分成單個字,如:王曉平在1月份灤南大會上說的確實在理,切分為:王/曉/平/在/1/月/份/灤/南/大/會/上/說/的/確/實/在/理?
組合詞組單元112、用于通過詞庫檢索對每個詞之間進行組合計算所有可能的詞組,得到所有詞組的組合:?
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于武漢中文百科網絡有限公司;北京四海書同文國際文化交流中心,未經武漢中文百科網絡有限公司;北京四海書同文國際文化交流中心許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310215166.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種靜壓支承試驗臺
- 下一篇:一種高速絲杠及絲杠副綜合檢查試驗臺





