[發明專利]文本編輯裝置和方法無效
| 申請號: | 200680051201.8 | 申請日: | 2006-12-18 |
| 公開(公告)號: | CN101361064A | 公開(公告)日: | 2009-02-04 |
| 發明(設計)人: | 休·勞森-坦克雷德 | 申請(專利權)人: | EMIL有限公司 |
| 主分類號: | G06F17/28 | 分類號: | G06F17/28 |
| 代理公司: | 北京德琦知識產權代理有限公司 | 代理人: | 羅正云;宋志強 |
| 地址: | 英國*** | 國省代碼: | 英國;GB |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文本編輯 裝置 方法 | ||
技術領域
本發明涉及文本編輯裝置和方法,并且具體來說,涉及用于在從一種語言向另一種語言的翻譯過程之后對文本進行后編輯的裝置和方法,或用于對任何機器生成的文本進行后編輯的裝置和方法。
背景技術
翻譯服務的需求日益增多,超過了世界貿易增長的速度,而世界貿易增長的速度又高于世界經濟的增長速度。如今,互聯網總通信量的半數以上使用非英語的語言,而且有證據表明英語在商業活動中更普遍地占支配地位的趨勢變得緩慢下來。翻譯職業的征聘雖然日益增加,但仍然供不應求。同時,自然語言處理的新技術帶來了在進行翻譯時使計算機更多地參與的前景。
在自然語言翻譯中,軟件的使用在傳統上有兩種主要的方法。第一是機器翻譯(MT),機器翻譯自從二十世紀九十年代起就一直存在,但到目前為止它也未能被確立為主流翻譯的可信基礎。隨著對統計和隨機技術使用的增多,在未來幾年,這種情況可能會有一定程度的改變,MT盡管在互聯網上得到廣泛地使用,但是仍需獲得普遍的認同。MT解決方案之所以被認為不可行的主要原因在于,對許多用途來說,機器翻譯的質量不夠高。由于MT系統與技術翻譯相比,相對不得要領,所以性能往往較差。這有許多原因。未被識別的單詞沒有被翻譯,而是僅僅被復制到翻譯后的文本中;對多義詞的翻譯可能給出對上下文來說是錯誤的意思,而且當源語句的句法結構的復雜性提高時,MT系統的效率也隨之降低。相似地,在語句結構相差很大的成對語言之間,MT系統的效率會比較低。這就導致有必要對機器翻譯后的文本進行后編輯,以便將質量提高到可接受的標準。使用目前的機器翻譯系統,可能需要花費大量的時間和精力來將MT系統的輸出轉換為具有人工質量的翻譯。
通常,機器翻譯軟件提供用戶界面,該用戶界面具有計算機屏幕上的第一區域和該屏幕上的第二區域,用戶可以在該第一區域通過打字或粘貼來輸入待翻譯的文本,并且機器翻譯的輸出在該第二區域顯示。當前使用最為普及的(也是最老的)MT系統之一是稱為“Systran”的軟件包,“Systran”允許選擇多種語言之間的互譯。
另一種主要的技術是翻譯記憶(TM)系統。翻譯記憶系統通過將所有的實際翻譯留給參與人員,并且僅提供用于(在某些文本或系列文本中可能會廣泛地)重用先前翻譯過的材料的有效系統,來避免MT的傳統問題,從而實現有時所說的機器輔助人工翻譯(MAHT)。現在可用的TM系統效率很低,因為它們要求對很多材料“首次”進行人工翻譯,然后才能由軟件有效地自動處理。
現今市場上有多種TM系統可用。例如,“Trados”TM系統是在使用中的最普及的TM系統之一。“Trados”通過提供“工作臺(workbench)”窗口來重復使用翻譯過的語句,從而避免用戶重復打字,所述“工作臺”窗口自動呈現相關源文本語句并將其與可用的任何相匹配的先前語句進行匹配。與Trados類似的系統允許用戶設置一“模糊匹配”的期望級別,如單個數值,其中100%表示只接受嚴格匹配。如果將模糊級別設置為100%以下,則系統將顯示先前翻譯過的與源文本部分匹配或嚴格匹配的語句,所述匹配的級別高于用戶所設置的門限值。有用的模糊匹配級別是90%以上。如果低于這個門限值,則編輯模糊匹配的工作量將高得驚人。然而,該系統僅對,例如被標識為由句號隔開的文本塊的完整語句進行匹配,并且不提供逐單詞或逐短語級別上的任何翻譯。
發明內容
本發明的一個方面提供一種至少從第一語言被翻譯成第二語言的文本進行編輯的文本編輯方法或設備。該裝置包括用于接收對文本進行選擇和/或編輯的用戶指令的用戶輸入裝置。該裝置包括用于生成待在顯示介質上顯示的顯示數據的顯示數據發生裝置。該裝置還包括控制器,該控制器以可操作的方式控制該顯示器來在第一顯示區域顯示用戶可編輯的翻譯后的文本,并在第二區域顯示預翻譯后的文本或用戶預編輯后的翻譯后的文本之一。該控制器被配置為在第一顯示區域中加亮文本的被選擇部分,在第二顯示區域中加亮該文本的對應部分,并且如果經由該用戶輸入裝置獲得新的文本選擇,則更新所述加亮。加亮可以包括最好在不擾亂對源文本的格式編排的情況下,使用粗體類型、斜體、下劃線、文本顏色、背景色、字體類型、字體大小等來將被加亮的文本與周圍的文本區分開。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于EMIL有限公司,未經EMIL有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200680051201.8/2.html,轉載請聲明來源鉆瓜專利網。





