[發明專利]一種機器輔助網頁翻譯方法及其系統無效
| 申請號: | 201210505632.4 | 申請日: | 2012-12-03 |
| 公開(公告)號: | CN103020044A | 公開(公告)日: | 2013-04-03 |
| 發明(設計)人: | 宗競 | 申請(專利權)人: | 江蘇樂買到網絡科技有限公司 |
| 主分類號: | G06F17/28 | 分類號: | G06F17/28;G06F17/27;G06F17/30 |
| 代理公司: | 蘇州威世朋知識產權代理事務所(普通合伙) 32235 | 代理人: | 楊林潔 |
| 地址: | 215123 江蘇省蘇州市蘇州工*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 機器 輔助 網頁 翻譯 方法 及其 系統 | ||
技術領域
本發明涉及一種機器輔助網頁翻譯方法及其系統。
背景技術
網頁翻譯系統的譯準率長期徘徊在70%左右,譯文的可讀性、系統對語言現象的覆蓋面、系統的魯棒性尤其是開放性都不盡人意。社會迫切需要對真實文本(尤其是網上海量文本)進行大規模的處理,而網頁翻譯系統同當今社會對大規模真實文本處理的期望相差甚遠。機器輔助翻譯(Computer?Aided?Translation,簡稱CAT)的思想就是在這樣的背景下產生的。與全自動機器翻譯系統相比較,機器輔助翻譯系統是一種人機交互式系統。在這種翻譯模式中,計算機負責輔助翻譯人員的任務,不僅給翻譯人員提供一些詞匯、術語、短語翻譯的知識,而且從已翻譯過文本中查找相同或相似語句的譯文,使翻譯人員避免不必要的重復勞動,進行高效率的翻譯工作。計算機輔助翻譯的重要思想(包括基于翻譯記憶技術和基于實例模式的翻譯技術)是在翻譯記憶庫(雙語對齊庫)和實例模式庫中搜索相同或相似的句子或短語,給出參考譯文。
翻譯人員充分利用已有的翻譯資源,盡量避免重復勞動。這種輔助翻譯機制特別適合于科技專著、科技文獻、產品說明書、使用手冊、聯合國文件等這種篇幅長、重復語言現象較多的文本類型的翻譯,能幫助翻譯人員消除重復的翻譯勞動,只需專注于新內容的翻譯。
機器翻譯記憶庫技術的機器輔助翻譯軟件基于這樣一個簡單的事實:由于專業翻譯領域所涉及的翻譯資料數量巨大,而范圍相對狹窄,集中于某個或某幾個專業,如政治、經濟、軍事、航天、計算機、通訊等專業都有自己的專業翻譯公司或部門。這就必然帶來翻譯資料的不同程度的重復。據統計,在不同行業和部門,這種資料的重復率達到20%~70%不等。這就意味著譯者至少有20%以上的工作是無謂的重復勞動。翻譯記憶技術就是從這里著手,首先致力于消除譯者的重復勞動,從而提高工作效率。
網頁翻譯功能是指在不改變網頁格式的前提下,將瀏覽器顯示的網頁上的語言文字翻譯成使用者所需要的語言文字。目前常見的網頁翻譯技術多是針對以超文字標記語言(Hyper?Text?Markup?Language,HTML)所寫成的網頁進行翻譯,其原理系先取得網頁之源文件(也就是HTML檔)的內容,之后尋找網頁中需要翻譯的文字(即HTML卷標之間的文字)進行翻譯,然后將翻譯的結果替代原文,并生成新的網頁,再指示瀏覽器顯示新生成的網頁。
發明內容
為了克服上述背景技術中的不足之處,本發明提供一種機器輔助網頁翻譯系統,包括接收網頁模塊、讀取網頁模塊以及翻譯網頁模塊,所述的翻譯網頁模塊通過以下幾個步驟實現:
第一步,翻譯過程,在翻譯新句子的時候,搜索翻譯記憶庫,對該句和記憶庫中翻譯單元進行對比和匹配,挑出原文最接近的翻譯單元,給出參考譯文;
第二步,自動建庫,自動分析和匹配原文和譯文,以句子為單位將原文和譯文一一對應然后自動生成一個標準的翻譯記憶庫文件,用戶所有的資料都可以通過該工具得到回收;
第三步,術語管理。對所有的術語進行規范,一次性建立一個或多個標準術語列表,在使用翻譯記憶系統翻譯時,打開術語管理工具中相應的術語列表,會自動識別出當前句子中有哪些詞是已定義的術語,并給出標準的術語譯文;
第四步,多語種之間進行雙向互譯;
第五步,自動排版,譯文自動套用原文的格式,進行自動排版。
根據一種采用上述方法的機器輔助網頁翻譯系統,其包括接收網頁模塊、讀取網頁模塊以及翻譯網頁模塊,所述接收網頁模塊通過解析器對網頁進行解析獲得文件對象模型,所述讀取網頁模塊讀取所述文件對象模型,所述翻譯網頁模塊對網頁進行翻譯、建庫、術語管理以及雙向互譯和排版。
附圖說明
為了更清楚地說明本發明實施例中的技術方案,下面將對實施例描述中所需要使用的附圖作簡單地介紹,顯而易見,下面描述中的附圖僅僅是本發明的部分實施例,對于本領域普通技術人員來講,在不付出創造性勞動的前提下,還可以根據這些附圖獲得其它附圖。
圖1示出了根據本發明的網頁翻譯流程。
具體實施方式
下面將結合本發明實施例中的附圖,對本發明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發明一部分實施例,而不是全部的實施例。基于本發明中的實施例,本領域普通技術人員在沒有作出創造性勞動前提下所獲得的所有其他實施例,都屬于本發明保護的范圍。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于江蘇樂買到網絡科技有限公司,未經江蘇樂買到網絡科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210505632.4/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:帶電校緊器
- 下一篇:一種中小尺寸芯片提高亮度和良率的制造方法





