[發明專利]包含術語翻譯的機器翻譯方法、裝置與電子設備有效
| 申請號: | 201910831775.6 | 申請日: | 2019-09-04 |
| 公開(公告)號: | CN110543644B | 公開(公告)日: | 2023-08-29 |
| 發明(設計)人: | 蔡潔 | 申請(專利權)人: | 語聯網(武漢)信息技術有限公司 |
| 主分類號: | G06F40/58 | 分類號: | G06F40/58;G06F40/289;G06F40/242 |
| 代理公司: | 北京路浩知識產權代理有限公司 11002 | 代理人: | 苗曉靜 |
| 地址: | 430206 湖北省武漢市東湖新技術開*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 包含 術語 翻譯 機器翻譯 方法 裝置 電子設備 | ||
本發明實施例提供一種包含術語翻譯的機器翻譯方法、裝置與電子設備,其中所述方法包括:將待翻譯文本按句進行分詞處理,并將分詞的結果與給定術語庫進行術語匹配,確定所述待翻譯文本中的術語,所述給定術語庫內存儲有源語言和目標語言術語對;將所述待翻譯文本中的術語用占位符進行替換,并基于所述給定術語庫,利用預先建立的目標機器翻譯模型,對所述替換后的待翻譯文本進行翻譯和術語替換,獲取包含術語譯文的翻譯結果。本發明實施例能夠有效克服在后編輯帶來的問題,從而有效提高翻譯效率和翻譯準確性。
技術領域
本發明涉及機器翻譯技術領域,更具體地,涉及一種包含術語翻譯的機器翻譯方法、裝置與電子設備。
背景技術
在文本翻譯過程中,相同的源“單詞”可能會被翻譯成不同的譯文,這其中可能存在兩方面因素的影響,其一單詞本身是多義詞,其二不同的譯員翻譯用詞習慣不同。在翻譯過程中,對于某些比較重要的詞,希望其翻譯結果是固定的,這些詞即被稱為“術語”。
為了使譯文中對這些術語的翻譯是統一固定的結果,目前采用的是術語替換的方式,即根據機器翻譯之后的結果,基于詞對齊做譯后編輯,替換譯文中對術語的翻譯結果。這樣做雖能夠實現對術語翻譯的統一,但是存在的問題一是處理速度不夠快,影響翻譯效率,二是如果翻譯有一些意譯的結果,則容易改變翻譯的含義,導致翻譯結果不準確。
發明內容
為了克服上述問題或者至少部分地解決上述問題,本發明實施例提供一種包含術語翻譯的機器翻譯方法、裝置與電子設備,用以有效克服在后編輯帶來的問題,從而有效提高翻譯效率和翻譯準確性。
第一方面,本發明實施例提供一種包含術語翻譯的機器翻譯方法,包括:
將待翻譯文本按句進行分詞處理,并將分詞的結果與給定術語庫進行術語匹配,確定所述待翻譯文本中的術語,所述給定術語庫內存儲有源語言和目標語言術語對;
將所述待翻譯文本中的術語用占位符進行替換,并基于所述給定術語庫,利用預先建立的目標機器翻譯模型,對所述替換后的待翻譯文本進行翻譯和術語替換,獲取包含術語譯文的翻譯結果。
第二方面,本發明實施例提供一種包含術語翻譯的機器翻譯裝置,包括:
術語匹配模塊,用于將待翻譯文本按句進行分詞處理,并將分詞的結果與給定術語庫進行術語匹配,確定所述待翻譯文本中的術語,所述給定術語庫內存儲有源語言和目標語言術語對;
術語替換翻譯模塊,用于將所述待翻譯文本中的術語用占位符進行替換,并基于所述給定術語庫,利用預先建立的目標機器翻譯模型,對所述替換后的待翻譯文本進行翻譯和術語替換,獲取包含術語譯文的翻譯結果。
第三方面,本發明實施例提供一種電子設備,包括存儲器、處理器及存儲在所述存儲器上并可在所述處理器上運行的計算機程序,所述處理器執行所述計算機程序時,實現如上第一方面所述的包含術語翻譯的機器翻譯方法的步驟。
第四方面,本發明實施例提供一種非暫態計算機可讀存儲介質,其上存儲有計算機指令,所述計算機指令被計算機執行時,實現如上第一方面所述的包含術語翻譯的機器翻譯方法的步驟。
本發明實施例提供的包含術語翻譯的機器翻譯方法、裝置與電子設備,根據訓練語料句對,生成滿足需求的訓練句對,通過在機器翻譯模型的訓練階段開始干涉,訓練出帶術語替換功能的翻譯模型,能夠有效克服在后編輯帶來的問題,從而有效提高翻譯效率和翻譯準確性。
附圖說明
為了更清楚地說明本發明實施例或現有技術中的技術方案,下面將對實施例或現有技術描述中所需要使用的附圖作一簡單地介紹,顯而易見地,下面描述中的附圖是本發明的一些實施例,對于本領域普通技術人員來講,在不付出創造性勞動的前提下,還可以根據這些附圖獲得其他的附圖。
圖1為本發明一實施例提供的包含術語翻譯的機器翻譯方法的流程示意圖;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于語聯網(武漢)信息技術有限公司,未經語聯網(武漢)信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910831775.6/2.html,轉載請聲明來源鉆瓜專利網。





