[發明專利]一種計算機在線翻譯方法及其翻譯系統無效
| 申請號: | 201210128506.1 | 申請日: | 2012-04-27 |
| 公開(公告)號: | CN102708097A | 公開(公告)日: | 2012-10-03 |
| 發明(設計)人: | 曾立人 | 申請(專利權)人: | 曾立人 |
| 主分類號: | G06F17/28 | 分類號: | G06F17/28 |
| 代理公司: | 金華科源專利事務所有限公司 33103 | 代理人: | 黃飛 |
| 地址: | 321000 浙江省金華*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 計算機 在線翻譯 方法 及其 翻譯 系統 | ||
技術領域
本發明屬于計算機輔助人工翻譯領域。
背景技術
目前的計算機輔助翻譯工具都是基于“翻譯記憶”的工作原理,即將翻譯好的文章以雙語對應的平行語料庫的形式存儲起來,下次翻譯同類文章時,計算機先將原文與平行語料庫里的原文進行對比,若有完全相同或部分相同的句子,計算機就將這個句子和譯文一起顯示給譯員,譯員可以直接拷貝或修改使用,以達到省時省力的效果,降低翻譯成本。
但是因為現有的計算機輔助翻譯工具不提供翻譯記憶庫,而譯者或翻譯公司自行建庫速度慢、難度大,加上大家都不想無償貢獻自己的勞動,所以一般翻譯記憶都是譯員自己使用或公司內部分享,不但浪費了很好的語言資產,也使得實現計算機輔助翻譯工具的省時省力功能變得很困難。
發明內容
本發明的目的是針對現有技術的不足,提供一種將源語文章分割為句子或更小單位,通過網絡發布到譯者群,并通過對句子在文章中的順序及譯者著作權標記,根據譯者工作量或翻譯記憶被引用的數量給譯者支付報酬,從而能使資源利用最大化、省時省力、翻譯效率高、成本低的計算機在線翻譯方法及其翻譯系統。
本發明采用如下技術方案:
一種計算機在線翻譯方法,其特征在于:需要翻譯的源文文本在上傳后被分割成句子單元;根據其在文章中的順序這些句子單元被打上身份和順序標簽;譯者選擇適當的句子單元翻譯后,該句子單元被打上譯者身份標簽;然后按照源語文本中的位置重新組合成完整的譯文;同時將翻譯好的句子單元放入在線翻譯記憶庫里供自動匹配器搜索,被匹配的句子單元記錄在譯者著作權統計信息里,以此支付每次被使用的稿酬。
本發明可以根據標點符號判斷等預定規則將源文分割成為句子單元,句子單元可以包括自然句子、詞組、單詞等。
根據上述方法,本發明提供了計算機在線翻譯系統,其特征在于:包括文本上傳器、文本切割器、句子身份和順序標記器、在線翻譯記憶庫、譯文輸入編輯器、翻譯記憶匹配器、譯文重組器,同時還帶有報酬結算器、譯文下載器,其中文本上傳器用于上傳需要翻譯的文本;文本切割器根據預定的規則按標點符號等判斷將源文分割成為句子單元;句子身份和順序標記器將每個句子標記上它在文章中的順序標簽;在線翻譯記憶庫記錄了所有譯員在本系統里翻譯過或另外提交的翻譯記憶;譯文輸入編輯器供譯員輸入與源語對應的譯文;翻譯記憶匹配器,它將譯員輸入的譯文與在線翻譯記憶庫里存儲的句子或詞組進行匹配對應,有完全匹配或部分匹配的,顯示給譯員進行選用;譯文重組器重新將譯文根據源語文本的順序組合成完整的譯文;譯員選用了他人的翻譯記憶,由譯者著作權統計器統計,報酬結算器里向翻譯記憶著作權所有人支付報酬;譯文下載器供下載完成的目標語譯文。
本系統還可帶有句子發布器和翻譯記憶質量評價裝置,句子發布器根據句子的復雜程度和難度將其分類,供不同的譯員選擇;翻譯記憶質量評價裝置反饋每個句子或譯者的翻譯質量,為以后譯者引用翻譯記憶作參考。
本發明由于譯者不但得到第一次翻譯該句子的稿酬,還能得到后續一次或多次翻譯記憶使用的稿酬。這種激勵機制會促使譯員或翻譯公司將其翻譯記憶放到在線翻譯記憶庫里與他人分享,使計算機輔助翻譯工具的效率大大提高;本系統通過以句子為單位登記譯者著作權,使譯員或翻譯公司將翻譯記憶拿出來有償分享,不但能從翻譯新句子時拿到稿酬,還可以從后續的翻譯記憶出售拿到多次稿酬,同時因為一篇文章可以拆散向整個譯者群發布,可以讓眾多譯員同時翻譯一篇文章,大大縮短交稿時間,等系統積累到大量的翻譯記憶后有望實現所有文章的自動翻譯,到那時,本系統即同時可以有機器翻譯的速度以及人工翻譯的質量,達到計算機輔助翻譯系統效率最大化。
附圖說明
圖1為本發明在線翻譯系統示意圖。
具體實施方式
一種計算機在線翻譯方法,包括如下步驟:
A、輸入要翻譯的源文;
B、根據標點符號判斷將源文分割成為自然句子;
C、將每個句子標記上其在源文中的順序發布給不同的譯者;
D、譯者將句子翻譯成目標語后,句子被標記上譯者身份信息;
E、按照源語文本中句子的順序將目標語組成完整譯文;
F、將翻譯好的句子單元放入在線翻譯記憶庫里供自動匹配器搜索,被匹配的句子單元記錄在譯者著作權統計信息里,以此支付每次被使用的稿酬。
本發明譯者可以查看句子的上下文,以更好地翻譯句子。
如圖1所示,本發明提供了計算機在線翻譯系統,翻譯客戶登錄客戶端后通過源語文本上傳器1上傳需要翻譯的文章,該文章由文本切割器2將文章根據標點符號判斷等預定規則將源文分割成為自然句子或詞組,句子身份和順序標記器3給每個句子標記上它在文章中的順序編號。編號后的句子通過句子發布器4向譯者用戶群發布。譯者用戶可以根據自己的翻譯水平和速度選擇適合自己翻譯的句子,在譯文輸入編輯器5輸入與源語句子對應的譯文。譯文輸入編輯器5里可以顯示句子所在的整片文章,供譯者更好地了解整篇文章的文體、風格和上下文結構。輸入的譯文通過翻譯記憶匹配器7在在線翻譯記憶庫6里尋找匹配,在線翻譯記憶庫6里存儲了其他譯者和譯者本人以前的翻譯記憶。找到和源語匹配的句子后在譯文輸入編輯器5里顯示其對應的目標語譯文翻譯記憶,供譯者選用。通過譯者著作權標記器8,譯者自己翻譯的句子被打上譯者著作權標簽,引用他人在在線翻譯記憶庫6里的句子則繼承原譯者的著作權標簽。各個譯者提交的譯文句子在譯文重組器9里根據源語的句子順序編號進行排列,獲得順序正確的完整譯文。譯者新翻譯的、在線翻譯記憶庫6里沒有的句子被當作翻譯記憶存儲到在線翻譯記憶庫里,為以后匹配的翻譯記憶源。譯者的工作量通過譯者著作權標記器8記錄,綜合計算新翻譯句子的字數和被引用的翻譯記憶的字數得出,通過報酬結算器10付費。付費后,客戶可以通過譯文下載器11下載完成的譯文。客戶和引用翻譯記憶的譯者可以通過翻譯記憶質量評價裝置12反饋每個句子或譯者的翻譯質量,為以后譯者引用翻譯記憶作參考。評價高的句子和譯者會被更多引用,達到激勵提高翻譯質量的目的。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于曾立人,未經曾立人許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210128506.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種可調光COB光源模組
- 下一篇:一種拉力檢測裝置





