[發(fā)明專利]翻譯方法及裝置有效
| 申請?zhí)枺?/td> | 201811075653.0 | 申請日: | 2018-09-14 |
| 公開(公告)號: | CN110909552B | 公開(公告)日: | 2023-05-30 |
| 發(fā)明(設計)人: | 宋楷;于恒 | 申請(專利權(quán))人: | 阿里巴巴集團控股有限公司 |
| 主分類號: | G06F40/58 | 分類號: | G06F40/58;G06N3/02 |
| 代理公司: | 北京博浩百睿知識產(chǎn)權(quán)代理有限責任公司 11134 | 代理人: | 褚敏;宋子良 |
| 地址: | 英屬開曼群島大開*** | 國省代碼: | 暫無信息 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 翻譯 方法 裝置 | ||
1.一種翻譯方法,其特征在于,包括:
獲取源端句子,其中,所述源端句子為輸入到神經(jīng)網(wǎng)絡中的待翻譯的句子,所述神經(jīng)網(wǎng)絡用于將所述源端句子從源語言翻譯成目標語言;
在使用所述神經(jīng)網(wǎng)絡將所述源端句子中的目標詞匯翻譯成目標譯文之前,選擇對所述目標詞匯的翻譯方式,其中,所述翻譯方式包括:從所述源端句子中的目標詞匯對應的干預譯文中確定作為所述目標詞匯的目標譯文、使用所述神經(jīng)網(wǎng)絡生成所述目標詞匯的目標譯文,所述干預譯文為指定將所述目標詞匯從源語言翻譯成預定的目標語言;
根據(jù)選擇出的所述翻譯方式對所述源端句子中的目標詞匯進行翻譯;
其中,獲取所述源端句子包括:
獲取待翻譯的原始句子;
將所述原始句子中的目標詞匯用對應的干預譯文替換;
將替換后得到的句子作為所述源端句子。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,將所述原始句子中的目標詞匯用對應的干預譯文替換包括:
獲取存在所述干預譯文的片段對應的第一向量;
獲取所述干預譯文對應的第二向量;
將所述第一向量替換為所述第二向量,其中,所述源端句子轉(zhuǎn)換后得到的一組向量。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,將所述原始句子中的目標詞匯用對應的干預譯文替換包括:
獲取存在所述干預譯文的片段對應的第一向量包括:從所述源語言的詞嵌入矩陣中獲取存在所述干預譯文的片段對應的第一向量;
獲取所述干預譯文對應的第二向量包括:從所述目標語言的詞嵌入矩陣中獲取所述干預譯文對應的第二向量,其中,所述源端句子經(jīng)過所述源語言的詞嵌入處理后得到的一組向量。
4.根據(jù)權(quán)利要求1至3中任一項所述的方法,其特征在于,在使用所述神經(jīng)網(wǎng)絡將所述源端句子中的目標詞匯翻譯成目標譯文之前,選擇對所述目標詞匯的翻譯方式包括:
通過訓練得到的分類器選擇對所述目標詞匯進行翻譯的方式。
5.根據(jù)權(quán)利要求1中所述的方法,其特征在于,若選擇出的翻譯方式為使用所述神經(jīng)網(wǎng)絡生成所述目標詞匯的目標譯文,根據(jù)選擇出的所述翻譯方式對所述源端句子中的目標詞匯進行翻譯包括:
使用所述神經(jīng)網(wǎng)絡對所述源端句子中的目標詞匯進行預測,使用預測出的詞語替代所述源端句子中的目標詞匯。
6.根據(jù)權(quán)利要求1中所述的方法,其特征在于,若選擇出的翻譯方式為從所述源端句子中的目標詞匯對應的干預譯文中確定作為所述目標詞匯的目標譯文,根據(jù)選擇出的所述翻譯方式對所述源端句子中的目標詞匯進行翻譯包括:
在預設目標詞匯庫中查詢所述源端句子中的目標詞匯對應的詞匯;
采用查詢到的詞匯替代所述源端句子中的目標詞匯。
7.一種翻譯裝置,其特征在于,包括:
獲取單元,用于獲取源端句子,其中,所述源端句子為輸入到神經(jīng)網(wǎng)絡中的待翻譯的句子,所述神經(jīng)網(wǎng)絡用于將所述源端句子從源語言翻譯成目標語言;
選擇單元,用于在使用所述神經(jīng)網(wǎng)絡將所述源端句子中的目標詞匯翻譯成目標譯文之前,選擇對所述目標詞匯的翻譯方式,其中,所述翻譯方式包括:從所述源端句子中的目標詞匯對應的干預譯文中確定作為所述目標詞匯的目標譯文、使用所述神經(jīng)網(wǎng)絡生成所述目標詞匯的目標譯文,所述干預譯文為指定將所述目標詞匯從源語言翻譯成預定的目標語言;
翻譯單元,用于根據(jù)選擇出的所述翻譯方式對所述源端句子中的目標詞匯進行翻譯;
其中,所述獲取單元包括:
第一獲取模塊,用于獲取待翻譯的原始句子;
第一替換模塊,用于將所述原始句子中的目標詞匯用對應的干預譯文替換;
確定模塊,用于將替換后得到的句子作為所述源端句子。
8.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述第一替換模塊包括:
第一獲取子模塊,用于獲取存在所述干預譯文的片段對應的第一向量;
第二獲取子模塊,用于獲取所述干預譯文對應的第二向量;
替換子模塊,用于將所述第一向量替換為所述第二向量,其中,所述源端句子轉(zhuǎn)換后得到的一組向量。
該專利技術資料僅供研究查看技術是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于阿里巴巴集團控股有限公司,未經(jīng)阿里巴巴集團控股有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811075653.0/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





