[發(fā)明專利]一種機器翻譯方法、裝置、電子設備及存儲介質(zhì)有效
| 申請?zhí)枺?/td> | 201811542809.1 | 申請日: | 2018-12-17 |
| 公開(公告)號: | CN109558604B | 公開(公告)日: | 2022-06-14 |
| 發(fā)明(設計)人: | 張睿卿;何中軍;吳華;王海峰 | 申請(專利權(quán))人: | 北京百度網(wǎng)訊科技有限公司 |
| 主分類號: | G06F40/58 | 分類號: | G06F40/58 |
| 代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 孟金喆 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 機器翻譯 方法 裝置 電子設備 存儲 介質(zhì) | ||
1.一種機器翻譯方法,其特征在于,所述方法包括:
將源語言的初始待翻譯文本翻譯為與其對應的目標語言的初始候選譯文;
獲取所述目標語言的初始候選譯文對應的M個目標語言的相似候選譯文;其中,M為大于1的自然數(shù);
將所述目標語言的初始候選譯文翻譯為與其對應的N個源語言的相似待翻譯文本;其中,N為大于1的自然數(shù);
根據(jù)M個目標語言的相似候選譯文以及N個源語言的相似待翻譯文本確定出M×N組翻譯樣本;根據(jù)M×N組翻譯樣本確定所述源語言的初始待翻譯文本對應的目標語言的目標候選譯文。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述獲取所述目標語言的初始候選譯文對應的M個目標語言的相似候選譯文,包括:
確定所述目標語言的初始候選譯文對應的目標語言的句表示向量;
根據(jù)所述目標語言的初始候選譯文對應的目標語言的句表示向量獲取所述目標語言的初始候選譯文對應的M個目標語言的相似候選譯文。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述將所述目標語言的初始候選譯文翻譯為與其對應的N個源語言的相似待翻譯文本,包括:
確定所述目標語言的初始候選譯文對應的源語言的句表示向量;
根據(jù)所述目標語言的初始候選譯文對應的源語言的句表示向量將所述目標語言的初始候選譯文翻譯為與其對應的N個源語言的相似待翻譯文本。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)M個目標語言的相似候選譯文以及N個源語言的相似待翻譯文本確定出M×N組翻譯樣本,包括:
計算各個目標語言的相似候選譯文與所述目標語言的初始候選譯文的置信度以及各個源語言的相似待翻譯文本與所述目標語言的初始候選譯文的置信度;
根據(jù)M個目標語言的相似候選譯文、N個源語言的相似待翻譯文本、各個目標語言的相似候選譯文與所述目標語言的初始候選譯文的置信度以及各個源語言的相似待翻譯文本與所述目標語言的初始候選譯文的置信度確定出M×N組翻譯樣本。
5.一種機器翻譯裝置,其特征在于,所述裝置包括:翻譯模塊、獲取模塊和確定模塊;其中,
所述翻譯模塊,用于將源語言的初始待翻譯文本翻譯為與其對應的目標語言的初始候選譯文;
所述獲取模塊,用于獲取所述目標語言的初始候選譯文對應的M個目標語言的相似候選譯文;其中,M為大于1的自然數(shù);
所述翻譯模塊,還用于將所述目標語言的初始候選譯文翻譯為與其對應的N個源語言的相似待翻譯文本;其中,N為大于1的自然數(shù);
所述確定模塊,用于根據(jù)M個目標語言的相似候選譯文以及N個源語言的相似待翻譯文本確定出M×N組翻譯樣本;根據(jù)M×N組翻譯樣本確定所述源語言的初始待翻譯文本對應的目標語言的目標候選譯文。
6.根據(jù)權(quán)利要求5所述的裝置,其特征在于:
所述獲取模塊,具體用于確定所述目標語言的初始候選譯文對應的目標語言的句表示向量;根據(jù)所述目標語言的初始候選譯文對應的目標語言的句表示向量獲取所述目標語言的初始候選譯文對應的M個目標語言的相似候選譯文。
7.根據(jù)權(quán)利要求5所述的裝置,其特征在于:
所述翻譯模塊,具體用于確定所述目標語言的初始候選譯文對應的源語言的句表示向量;根據(jù)所述目標語言的初始候選譯文對應的源語言的句表示向量將所述目標語言的初始候選譯文翻譯為與其對應的N個源語言的相似待翻譯文本。
8.根據(jù)權(quán)利要求5所述的裝置,其特征在于:
所述確定模塊,具體用于計算各個目標語言的相似候選譯文與所述目標語言的初始候選譯文的置信度以及各個源語言的相似待翻譯文本與所述目標語言的初始候選譯文的置信度;根據(jù)M個目標語言的相似候選譯文、N個源語言的相似待翻譯文本、各個目標語言的相似候選譯文與所述目標語言的初始候選譯文的置信度以及各個源語言的相似待翻譯文本與所述目標語言的初始候選譯文的置信度確定出M×N組翻譯樣本。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京百度網(wǎng)訊科技有限公司,未經(jīng)北京百度網(wǎng)訊科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811542809.1/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





