[發明專利]翻譯方法及裝置有效
| 申請號: | 201811075653.0 | 申請日: | 2018-09-14 |
| 公開(公告)號: | CN110909552B | 公開(公告)日: | 2023-05-30 |
| 發明(設計)人: | 宋楷;于恒 | 申請(專利權)人: | 阿里巴巴集團控股有限公司 |
| 主分類號: | G06F40/58 | 分類號: | G06F40/58;G06N3/02 |
| 代理公司: | 北京博浩百睿知識產權代理有限責任公司 11134 | 代理人: | 褚敏;宋子良 |
| 地址: | 英屬開曼群島大開*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 翻譯 方法 裝置 | ||
本發明公開了一種翻譯方法及裝置。該方法包括:獲取源端句子,其中,源端句子為輸入到神經網絡中的待翻譯的句子,神經網絡用于將源端句子從源語言翻譯成目標語言;在使用神經網絡將源端句子中的目標詞匯翻譯成目標譯文之前,選擇對目標詞匯的翻譯方式,翻譯方式包括以下之一:從源端句子中的目標詞匯對應的干預譯文中確定作為目標詞匯的目標譯文、使用神經網絡生成目標詞匯的目標譯文,干預譯文為指定將目標詞匯從源語言翻譯成預定的目標語言;根據選擇出的翻譯方式對源端句子中的目標詞匯進行翻譯,本發明解決了由于相關技術中翻譯方法較單一,難以針對翻譯內容進行翻譯方式的選擇的技術問題。
技術領域
本發明涉及翻譯技術領域,具體而言,涉及一種翻譯方法及裝置。
背景技術
隨著技術的發展,各種翻譯工具已上線了神經網絡翻譯系統,簡稱NMT模型,干預機制是支持線上翻譯場景的基本必備機制,可以用于對誤翻譯的修復,以及提高場景內的專業術語和商品核心關鍵信息的翻譯準確度等重要問題,當前翻譯干預機制實現了基于標簽替換的硬干預,上線后對于NMT具備了基本的干預能力,效果明顯。但是存在以下缺點:1)基于標簽替換的硬干預的方式會使翻譯過程損失原文信息,導致譯文忠誠度和流暢度的下降,這種方式只能保證干預譯文片段出現在最終譯文中,但對整體譯文的質量有較大損失。2)基于標簽的硬干預方式不具備消歧能力,針對一個源語言片段,只能給出一種固定的干預譯文,不能從多個給定候選譯文中選擇最適合當前語境的譯文。3)當一個句子中待干預片段較多時,基于標簽替換的方式不能保證所有待干預片段都在最終譯文中生效,生效比率取決于源端句子中的干預標簽在譯文中被成功預測出來的比率。相關技術中的翻譯方法較單一,難以針對不同的翻譯內容進行翻譯方式的選擇。
針對上述的問題,目前尚未提出有效的解決方案。
發明內容
本發明實施例提供了一種翻譯方法及裝置,以至少解決由于相關技術中翻譯方法較單一,難以針對翻譯內容進行翻譯方式的選擇的技術問題。
根據本發明實施例的一個方面,提供了一種翻譯方法,包括:獲取源端句子,其中,所述源端句子為輸入到神經網絡中的待翻譯的句子,所述神經網絡用于將所述源端句子從源語言翻譯成目標語言;在使用所述神經網絡將所述源端句子中的目標詞匯翻譯成目標譯文之前,選擇對所述目標詞匯的翻譯方式,其中,所述翻譯方式包括以下之一:從所述源端句子中的目標詞匯對應的干預譯文中確定作為所述目標詞匯的目標譯文、使用所述神經網絡生成所述目標詞匯的目標譯文,所述干預譯文為指定將所述目標詞匯從源語言翻譯成預定的目標語言;根據選擇出的所述翻譯方式對所述源端句子中的目標詞匯進行翻譯。
進一步地,獲取所述源端句子包括:獲取待翻譯的原始句子;將所述原始句子中的目標詞匯用對應的干預譯文替換;將替換后得到的句子作為所述源端句子。
進一步地,將所述原始句子中的目標詞匯用對應的干預譯文替換包括:獲取存在所述干預譯文的片段對應的第一向量;獲取所述干預譯文對應的第二向量;將所述第一向量替換為所述第二向量,其中,所述源端句子轉換后得到的一組向量。
進一步地,將所述原始句子中的目標詞匯用對應的干預譯文替換包括:獲取存在所述干預譯文的片段對應的第一向量包括:從所述源語言的詞嵌入矩陣中獲取存在所述干預譯文的片段對應的第一向量;獲取所述干預譯文對應的第二向量包括:從所述目標語言的詞嵌入矩陣中獲取所述干預譯文對應的第二向量,其中,所述源端句子經過所述源語言的詞嵌入處理后得到的一組向量。
進一步地,在使用所述神經網絡將所述源端句子中的目標詞匯翻譯成目標譯文之前,選擇對所述目標詞匯的翻譯方式包括:通過訓練得到的分類器選擇對所述目標詞匯進行翻譯的方式。
進一步地,若選擇出的翻譯方式為使用所述神經網絡生成所述目標詞匯的目標譯文,根據選擇出的所述翻譯方式對所述源端句子中的目標詞匯進行翻譯包括:使用所述神經網絡對所述源端句子中的目標詞匯進行預測,使用預測出的詞語替代所述源端句子中的目標詞匯。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于阿里巴巴集團控股有限公司,未經阿里巴巴集團控股有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811075653.0/2.html,轉載請聲明來源鉆瓜專利網。





