[發明專利]詞匯式繁體中文與簡體中文的轉換系統及轉換方法無效
| 申請號: | 01104564.7 | 申請日: | 2001-02-16 |
| 公開(公告)號: | CN1369833A | 公開(公告)日: | 2002-09-18 |
| 發明(設計)人: | 楊立偉 | 申請(專利權)人: | 意藍科技股份有限公司 |
| 主分類號: | G06F17/28 | 分類號: | G06F17/28 |
| 代理公司: | 北京市柳沈律師事務所 | 代理人: | 宋軍 |
| 地址: | 臺灣省*** | 國省代碼: | 臺灣;71 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 詞匯 繁體中文 簡體中文 轉換 系統 方法 | ||
本發明涉及一種詞匯式繁體中文與簡體中文的轉換系統,尤其是一種利用長詞優先斷詞法進行詞匯分割之后再予以轉換漢字的詞匯式繁體中文與簡體中文的轉換系統。本發明亦包括利用上述詞匯式繁體中文與簡體中文的轉換系統進行簡繁漢字轉換的詞匯式繁體中文與簡體中文的轉換方法。
目前世界上所使用的中文電腦系統中,通行的漢字系統分為兩種:一為繁體中文系統,如臺灣以及香港所采用的漢字系統;另一為簡體中文系統,如中國大陸及新加坡所采用者。由一種漢字系統所編輯出來的文字數據并不能直接由另一種漢字系統處理。也就是說,繁體中文系統不能處理簡體中文文字數據;而簡體中文系統則無法處理繁體中文文字數據。
為使電腦能同時處理二種中文數據,必須先利用簡繁漢字轉換系統,將電腦不能辨識的漢字轉換成電腦可以辨識的漢字。如此,使用任何一種中文系統的電腦可以同時處理簡/繁漢字,而不受所使用的中文系統限制。
現有的簡繁漢字轉換系統中,其簡繁漢字的轉換方法,均使用單字對應單字的轉換運算。即,現有系統中的漢字轉換法以每一個漢字單字為處理單位,由一簡/繁單字對應表,進行單字對單字的對應運算,然后逐字地轉換單字,使每一單字轉換成電腦系統可辨識的漢字。
例如,圖3(a)的現有簡繁漢字轉換系統所用的簡繁漢字轉換法步驟中,首先在數據接收步驟701中,將待轉換中文文件70的一漢字取出;接著,在簡繁漢字轉換步驟702中,將所取出的漢字對照內建的單字對應表80,找出相對應的譯字。如果漢字能在單字對應表80中具有相對應的譯字,則將漢字進行轉換,成為單字對應表80中所對應到的譯字。將待轉換中文文件70的每一個漢字逐一進行上述的對應及轉換,使待轉換中文文件所有可對應于單字對應表80的漢字均替換成所要的譯字。最后,在輸出步驟703中輸出。藉此,待轉換中文文件70被轉換成電腦系統兼容的中文文件90,達成將簡體中文文件轉換成繁體中文文件或將繁體中文文件轉換成簡體中文文件的目的。
例如,所輸入的待轉換中文文件70為“馬鈴薯是一種植物”時,其中各個漢字71(圖3(b))會逐一地轉換成相對應的譯字711(圖3(c))。
然而,上述現有簡繁漢字轉換系統所用的漢字轉換法,在實際的文字數據轉換應用上存在有許多的缺點。因為在使用簡繁漢字的人民中,某些同義的詞匯,其用語并不相同,甚至用語字數不同。因此,現有簡繁漢字轉換系統的單字對應單字的轉換方法,不能確實地將一漢字轉換成所要的另一種漢字。
前述的例子中,英文中的potato,在臺灣的民眾會叫它為“馬鈴薯”或“洋芋”,然而,在中國大陸的人民則會叫它為“土豆”。故當繁體中文文件以單字對應單字的關系轉換時,在繁體漢字中的詞匯“馬鈴薯”并無法精確地轉換成簡體漢字中的詞匯“土豆”,使大眾不易理解被轉換的文件。反之亦然,當簡體漢字的詞匯“土豆”以單字對應單字的方式轉換時,其也無法轉換成繁體漢字的詞匯“馬鈴薯”或“洋芋”。故,有必要對此一缺點提出解決之道。
針對上述問題,本發明的一目的為提供一種能夠確實地進行簡繁漢字轉換的詞匯式繁體中文與簡體中文的轉換系統。
為完成本發明上述目的,詞匯式繁體中文與簡體中文的轉換系統包括一數據接收模塊、一斷詞處理模塊、一簡繁漢字轉換模塊、及一輸出模塊,其中斷詞處理模塊能依照長詞優先斷詞法對數據進行分割。
因為,斷詞處理模塊依照長詞優先斷詞法,對待轉換數據中的所有文字進行詞匯對應運算,而在該待轉換數據中優先分割出符合斷詞處理模塊內最長復合詞的復合詞,而成為待轉換復合詞,所以本發明的詞匯式繁體中文與簡體中文的轉換系統,能夠進行復合詞的轉換,使繁體及簡體漢字之間的轉換更加確實。本發明的另一目的為提供一種利用上述詞匯式繁體中文與簡體中文的轉換系統進行簡繁漢字轉換的詞匯式繁體中文與簡體中文的轉換方法。
附圖的簡單說明
圖1為一示意圖,顯示依本發明較佳實施例的詞匯式繁體中文與簡體中文的轉換系統。
圖2(a)為一示意圖,顯示依本發明較佳實施例的詞匯式繁體中文與簡體中文的轉換方法的步驟。
圖2(b)為一示意圖,顯示依圖2(a)的本發明較佳實施例的詞匯式繁體中文與簡體中文的轉換方法的步驟所要處理的待轉換數據。
圖2(c)為一示意圖,顯示在依照圖2(a)的本發明較佳實施例的詞匯式繁體中文與簡體中文的轉換方法的斷詞處理步驟之后,待轉換數據被切割成待轉換復合詞及待轉換單字。
圖2(d)為一示意圖,顯示在依照圖2(a)的本發明較佳實施例的詞匯式繁體中文與簡體中文的轉換方法的簡繁漢字轉換步驟的待轉換復合詞及待轉換單字與相對應的復合詞及單字的對應關系。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于意藍科技股份有限公司,未經意藍科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/01104564.7/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:中式烹調燃氣火力控制裝置
- 下一篇:一種重鉻酸鈉廢渣資源化處理再制磚





