[發明專利]一種翻譯的方法、目標信息確定的方法及相關裝置有效
| 申請號: | 201710612833.7 | 申請日: | 2017-07-25 |
| 公開(公告)號: | CN107368476B | 公開(公告)日: | 2020-11-03 |
| 發明(設計)人: | 涂兆鵬;周浩;史樹明 | 申請(專利權)人: | 深圳市騰訊計算機系統有限公司 |
| 主分類號: | G06F40/58 | 分類號: | G06F40/58 |
| 代理公司: | 深圳市深佳知識產權代理事務所(普通合伙) 44285 | 代理人: | 王仲凱 |
| 地址: | 518000 廣東省深圳市南*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 翻譯 方法 目標 信息 確定 相關 裝置 | ||
本發明公開了一種目標信息確定的方法,包括:對待處理文本信息進行編碼處理,以得到源端向量表示序列;根據源端向量表示序列獲取第一時刻對應的源端上下文向量,源端上下文向量用于表示待處理的源端內容;根據源端向量表示序列以及源端上下文向量確定第一翻譯向量和/或第二翻譯向量,第一翻譯向量指示第一時刻內在源端向量表示序列中未被翻譯的源端內容,第二翻譯向量指示第二時刻內在源端向量表示序列中已經被翻譯的源端內容;對第一翻譯向量和/或第二翻譯向量以及源端上下文向量進行解碼處理,以得到第一時刻的目標信息。本發明還提供一種翻譯的方法以及目標信息確定裝置。本發明可以降低解碼器的模型訓練難度,提高翻譯系統的翻譯效果。
技術領域
本發明涉及計算機技術領域,尤其涉及一種翻譯的方法、目標信息確定的方法及相關裝置。
背景技術
機器翻譯(machine translation,MT)是指使用機器將文本或言語從一種語言轉化為具有相同含義內容的另一種語言的過程。隨著深度學習的興起,最近兩年深層神經網絡技術在MT上也得到應用,神經網絡機器翻譯(neural machine translation,NMT)成為新一代翻譯技術。
目前,NMT使用編碼器-解碼器框架來實現理解語義再翻譯的過程,該過程主要包括編碼器生成當前時刻的源端向量表示,然后由解碼器根據源端向量表示和當前時刻源端上下文,輸出當前時刻的解碼器狀態,最后根據該解碼器狀態選擇相似度最高的一個詞作為目標詞。
然而,在現有方案中,解碼器需要建立語言模型,記錄過去翻譯過的信息以及記錄未來需要翻譯的信息,這些操作都會增加解碼器的模型訓練難度,降低模型訓練的準確度,從而容易出現重復翻譯和遺漏翻譯的情況。
發明內容
本發明實施例提供了一種翻譯的方法、目標信息確定的方法及相關裝置,可以對源端向量表示序列中未被翻譯的源端內容和/或已被翻譯的源端內容進行建模處理,即把這部分內容從原來的語言模型中剝離出來進行訓練,從而降低解碼器的模型訓練難度,提高翻譯系統的翻譯效果。
有鑒于此,本發明第一方面提供了一種翻譯的方法,所述方法應用于神經網絡機器翻譯NMT系統,所述方法包括:
采用編碼器對待處理文本信息進行編碼處理,以得到源端向量表示序列,其中,所述待處理文本信息屬于第一語言;所述源端向量表示序列中每個向量對應一個源端內容;
根據所述源端向量表示序列獲取第一時刻對應的源端上下文向量,其中,所述源端上下文向量用于表示待處理的源端內容;
根據所述源端向量表示序列以及所述源端上下文向量確定第一翻譯向量和/或第二翻譯向量,其中,所述第一翻譯向量指示第一時刻內在所述源端向量表示序列中未被翻譯的源端內容,第二翻譯向量指示第二時刻內在所述源端向量表示序列中已經被翻譯的源端內容,所述第二時刻為所述第一時刻之前相鄰的一個時刻;
采用解碼器對所述第一翻譯向量和/或所述第二翻譯向量以及所述源端上下文向量進行解碼處理,以得到第一時刻的目標信息,其中,所述目標信息屬于第二語言。
本發明第二方面提供了一種目標信息確定的方法,包括:
對待處理文本信息進行編碼處理,以得到源端向量表示序列;所述源端向量表示序列中每個向量對應一個源端內容;
根據所述源端向量表示序列獲取第一時刻對應的源端上下文向量,其中,所述源端上下文向量用于表示待處理的源端內容;
根據所述源端向量表示序列以及所述源端上下文向量確定第一翻譯向量和/或第二翻譯向量,其中,所述第一翻譯向量指示第一時刻內在所述源端向量表示序列中未被翻譯的源端內容,第二翻譯向量指示第二時刻內在所述源端向量表示序列中已經被翻譯的源端內容,所述第二時刻為所述第一時刻之前相鄰的一個時刻;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳市騰訊計算機系統有限公司,未經深圳市騰訊計算機系統有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710612833.7/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種室內照明用環藝旋轉吊燈
- 下一篇:一種智能路燈
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置





