[發明專利]基于多語言機器翻譯模型的翻譯方法、裝置、設備和介質在審
| 申請號: | 202011409340.1 | 申請日: | 2020-12-04 |
| 公開(公告)號: | CN112380876A | 公開(公告)日: | 2021-02-19 |
| 發明(設計)人: | 趙程綺;朱耀明;王明軒;封江濤;李磊 | 申請(專利權)人: | 北京有竹居網絡技術有限公司 |
| 主分類號: | G06F40/42 | 分類號: | G06F40/42;G06F40/30 |
| 代理公司: | 北京遠智匯知識產權代理有限公司 11659 | 代理人: | 范坤坤 |
| 地址: | 101299 北京市平*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 語言 機器翻譯 模型 翻譯 方法 裝置 設備 介質 | ||
本公開實施例提供了一種基于多語言機器翻譯模型的翻譯方法、裝置、設備和介質。該方法包括:獲取待翻譯的原始語句和所述原始語句的翻譯語言信息;確定與所述原始語句的翻譯語言信息對應的目標適配器,其中,所述目標適配器用于校正預先設置的多語言機器翻譯模型的翻譯誤差;基于所述多語言機器翻譯模型和所述目標適配器對所述原始語句進行翻譯,得到目標語句。本公開實施例通過采用上述技術方案,采用適配器校正多語言機器翻譯模型的翻翻譯誤差,能夠提高多語言翻譯模型所輸出的翻譯結果的準確性。
技術領域
本公開實施例涉及計算機技術領域,尤其涉及一種基于多語言機器翻譯模型的翻譯方法、裝置、設備和介質。
背景技術
機器翻譯(Machine Translation,MT)是自然語言處理方向中的核心任務之一,旨在利用計算機程序將一種自然語言翻譯為另一種自然語言。
傳統的機器翻譯模型一般為雙語機器翻譯模型,此類機器翻譯模型能處理一個語言方向的翻譯,如將英文翻譯為中文。由于當語種的數量較大時,需要訓練非常多的雙語機器翻譯模型才能實現每對語自然語言之間的兩兩互譯,近年來,多語言機器翻譯模型逐漸替代雙語機器翻譯模型,成為常用的機器翻譯模型之一。
然而,在相同的參數配置和模型架構下,多語言機器翻譯模型的性能往往劣于雙語機器翻譯模型的性能,導致多語言機器翻譯模型輸出的翻譯結果的存在較大的翻譯誤差。
發明內容
本公開實施例提供一種基于多語言機器翻譯模型的翻譯方法、裝置、設備和介質,以提高多語言機器翻譯模型輸出的翻譯結果的準確性。
第一方面,本公開實施例提供了一種基于多語言機器翻譯模型的翻譯方法,包括:
獲取待翻譯的原始語句和所述原始語句的翻譯語言信息;
確定與所述原始語句的翻譯語言信息對應的目標適配器,其中,所述目標適配器用于校正預先設置的多語言機器翻譯模型的翻譯誤差;
基于所述多語言機器翻譯模型和所述目標適配器對所述原始語句進行翻譯,得到目標語句。
第二方面,本公開實施例還提供了一種基于多語言機器翻譯模型的翻譯裝置,包括:
語句獲取模塊,用于獲取待翻譯的原始語句和所述原始語句的翻譯語言信息;
適配器確定模塊,用于確定與所述原始語句的翻譯語言信息對應的目標適配器,其中,所述目標適配器用于校正預先設置的多語言機器翻譯模型的翻譯誤差;
翻譯模塊,用于基于所述多語言機器翻譯模型和所述目標適配器對所述原始語句進行翻譯,得到目標語句。
第三方面,本公開實施例還提供了一種電子設備,包括:
一個或多個處理器;
存儲器,用于存儲一個或多個程序,
當所述一個或多個程序被所述一個或多個處理器執行,使得所述一個或多個處理器實現如本公開實施例所述的方法。
第四方面,本公開實施例還提供了一種計算機可讀存儲介質,其上存儲有計算機程序,該程序被處理器執行時實現如本公開實施例所述的方法。
本公開實施例提供的基于多語言機器翻譯模型的翻譯方法、裝置、設備和介質,獲取待翻譯的原始語句和該原始語句的翻譯語言信息,確定與該原始語句的翻譯語言信息對應的、用于校正預先設置的多語言機器翻譯模型的翻譯誤差的目標適配器,并基于該多語言機器翻譯模型和該目標適配器對原始語句進行翻譯,得到目標語句。本公開實施例通過采用上述技術方案,采用適配器校正多語言機器翻譯模型的翻翻譯誤差,能夠提高多語言翻譯模型所輸出的翻譯結果的準確性。
附圖說明
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京有竹居網絡技術有限公司,未經北京有竹居網絡技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011409340.1/2.html,轉載請聲明來源鉆瓜專利網。





