[發(fā)明專利]輔助翻譯方法在審
| 申請(qǐng)?zhí)枺?/td> | 202111155095.0 | 申請(qǐng)日: | 2021-09-29 |
| 公開(公告)號(hào): | CN113947094A | 公開(公告)日: | 2022-01-18 |
| 發(fā)明(設(shè)計(jì))人: | 李光華;張娜 | 申請(qǐng)(專利權(quán))人: | 甲骨易(北京)語言科技股份有限公司 |
| 主分類號(hào): | G06F40/58 | 分類號(hào): | G06F40/58;G06F40/49 |
| 代理公司: | 北京金蓄專利代理有限公司 11544 | 代理人: | 趙敏 |
| 地址: | 101399 北京市順*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 輔助 翻譯 方法 | ||
本發(fā)明提供了一種融合譯者輸入、記憶庫(kù)片段/術(shù)語庫(kù)及實(shí)時(shí)預(yù)覽的輔助翻譯方法,包括:第一步驟:將譯者上傳的可編輯文檔以句為單位解析和拆分為獨(dú)立句段;第二步驟:將獨(dú)立句段與記憶庫(kù)和術(shù)語庫(kù)進(jìn)行關(guān)聯(lián),同時(shí)批量抽取記憶庫(kù)片段,以融合到交互式翻譯環(huán)節(jié)給譯員的推薦譯文中第三步驟:將解析后的獨(dú)立句段中的文檔展示為可在瀏覽器預(yù)覽和編輯的HTML格式,同時(shí)對(duì)解析后的獨(dú)立句段中的句對(duì)進(jìn)一步作分詞,用于術(shù)語庫(kù)匹配;第四步驟:將解析后的句段和分詞結(jié)果在關(guān)聯(lián)的記憶庫(kù)和/或術(shù)語庫(kù)中進(jìn)行匹配,并且將滿足預(yù)定條件的句子進(jìn)行標(biāo)記;第五步驟:機(jī)器翻譯引擎返回譯文。
技術(shù)領(lǐng)域
本發(fā)明涉及一種融合譯者輸入、記憶庫(kù)片段/術(shù)語庫(kù)及實(shí)時(shí)預(yù)覽的輔助翻譯方法。
背景技術(shù)
神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯使得自動(dòng)翻譯譯文對(duì)譯者有較大參考意義,目前市場(chǎng)上較為流行的翻譯方式是譯后編輯模式(第一類方案)——即讓譯者直接修改自動(dòng)翻譯的譯文。還有一類方案是基于譯者輸入片段重新解碼生成譯文的交互式翻譯(第二類方案),機(jī)器根據(jù)譯者輸入實(shí)時(shí)推薦譯文,不提供記憶庫(kù)片段/術(shù)語庫(kù)融合、以及編輯器預(yù)覽。
第一類方案的缺點(diǎn)是機(jī)翻譯文直接占據(jù)譯文輸入框,限制了譯者翻譯思路,容易誤導(dǎo)譯員,導(dǎo)致譯員只對(duì)機(jī)器翻譯結(jié)果作小修小補(bǔ),且譯者修改的內(nèi)容無法實(shí)現(xiàn)機(jī)器模型增量學(xué)習(xí)。第二類方案的缺點(diǎn)是沒有融合譯者記憶庫(kù)片段和術(shù)語庫(kù)、以及全文預(yù)覽信息,在交互式翻譯提示時(shí),僅提供基于機(jī)器翻譯的推薦譯文,不能融合當(dāng)前句段對(duì)應(yīng)的記憶庫(kù)片段和術(shù)語實(shí)時(shí)推薦譯文,導(dǎo)致推薦準(zhǔn)確度不高,對(duì)譯者效率提升有限。
發(fā)明內(nèi)容
本發(fā)明所要解決的技術(shù)問題是針對(duì)現(xiàn)有技術(shù)中存在上述缺陷,提供一種融合譯者輸入、記憶庫(kù)片段/術(shù)語庫(kù)及實(shí)時(shí)預(yù)覽的輔助翻譯方法,旨在通過融合譯者輸入、記憶庫(kù)片段/術(shù)語庫(kù),以及實(shí)時(shí)預(yù)覽的方式,提升譯者翻譯效率。
根據(jù)本發(fā)明,提供了一種融合譯者輸入、記憶庫(kù)片段/術(shù)語庫(kù)及實(shí)時(shí)預(yù)覽的輔助翻譯方法包括:
第一步驟:將譯者上傳的可編輯文檔以句為單位解析和拆分為獨(dú)立句段;
第二步驟:將獨(dú)立句段與記憶庫(kù)和術(shù)語庫(kù)進(jìn)行關(guān)聯(lián);同時(shí)批量抽取記憶庫(kù)片段,以融合到交互式翻譯環(huán)節(jié)給譯員的推薦譯文中;
第三步驟:將解析后的獨(dú)立句段中的文檔展示為可在瀏覽器預(yù)覽和編輯的HTML格式,同時(shí)對(duì)解析后的獨(dú)立句段中的句對(duì)進(jìn)一步作分詞,用于術(shù)語庫(kù)匹配;
第四步驟:將解析后的句段和分詞結(jié)果在關(guān)聯(lián)的記憶庫(kù)和/或術(shù)語庫(kù)中進(jìn)行匹配,并且將滿足預(yù)定條件的句子進(jìn)行標(biāo)記,并傳遞給機(jī)器翻譯引擎;
第五步驟:機(jī)器翻譯引擎返回譯文。
優(yōu)選地,第五步驟將譯文和原文展示在編輯器,供譯者預(yù)覽和翻譯。
優(yōu)選地,所述融合譯者輸入、記憶庫(kù)片段/術(shù)語庫(kù)及實(shí)時(shí)預(yù)覽的輔助翻譯方法還包括:
第六步驟:按照譯者光標(biāo)位置,逐句匹配記憶庫(kù)和術(shù)語庫(kù)結(jié)果,將滿足預(yù)定條件的匹配結(jié)果發(fā)送給機(jī)器翻譯引擎。
優(yōu)選地,所述融合譯者輸入、記憶庫(kù)片段/術(shù)語庫(kù)及實(shí)時(shí)預(yù)覽的輔助翻譯方法還包括:
第七步驟:獲取譯者輸入片段,以及相應(yīng)的記憶庫(kù)片段和術(shù)語,用于干預(yù)機(jī)器翻譯解碼結(jié)果,將機(jī)翻重新翻譯的結(jié)果返回給譯員。
第八步驟:譯員確定該句譯文后,將該句確認(rèn)后的術(shù)語和記憶庫(kù)片段實(shí)時(shí)存儲(chǔ),用于后續(xù)機(jī)器翻譯引擎輸入結(jié)果干預(yù)。
第九步驟:定期將譯員確認(rèn)的原文和譯文用于機(jī)器翻譯模型增量學(xué)習(xí)。
優(yōu)選地,所述融合譯者輸入、記憶庫(kù)片段/術(shù)語庫(kù)及實(shí)時(shí)預(yù)覽的輔助翻譯方法還包括:機(jī)器翻譯引擎根據(jù)收集的原文和譯文進(jìn)行增量學(xué)習(xí),并更新機(jī)器翻譯引擎,以便下次輸出質(zhì)量更佳的譯文。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于甲骨易(北京)語言科技股份有限公司,未經(jīng)甲骨易(北京)語言科技股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111155095.0/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 一種構(gòu)建多語言網(wǎng)站實(shí)時(shí)翻譯的方法
- 一種待翻譯軟件的翻譯方法及裝置
- 一種待翻譯軟件的翻譯方法及裝置
- 一種CAT系統(tǒng)中翻譯記憶庫(kù)和MT結(jié)合的方法及系統(tǒng)
- 翻譯方法、系統(tǒng)、終端以及存儲(chǔ)介質(zhì)
- 一種文本展示方法及裝置
- 機(jī)器翻譯方法及裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 基于機(jī)器翻譯引擎的翻譯方法及裝置
- 翻譯系統(tǒng)、翻譯方法、翻譯機(jī)及存儲(chǔ)介質(zhì)
- 文字翻譯方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種數(shù)據(jù)庫(kù)讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





