[發明專利]一種機器翻譯的方法、設備以及計算機可讀存儲介質有效
| 申請號: | 201810131743.0 | 申請日: | 2018-02-08 |
| 公開(公告)號: | CN110134971B | 公開(公告)日: | 2022-12-16 |
| 發明(設計)人: | 劉樂茂;李昕同;史樹明 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F40/58 | 分類號: | G06F40/58;G06F40/268 |
| 代理公司: | 深圳市深佳知識產權代理事務所(普通合伙) 44285 | 代理人: | 王仲凱 |
| 地址: | 518057 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 機器翻譯 方法 設備 以及 計算機 可讀 存儲 介質 | ||
本申請實施例公開了一種機器翻譯的方法。本申請實施例方法包括:接收待處理信息,所述待處理信息以源語言表示;采用編碼器對所述待處理信息進行編碼處理,生成所述待處理信息的表示向量序列;通過預測模型預測第一時刻待翻譯的目標展望詞的特征信息,所述目標展望詞以目標語言表示;根據所述目標展望詞的特征信息確定所述表示向量序列中當前時刻對應的上下文向量;采用解碼器對所述上下文向量進行解碼處理,得到所述上下文向量對應的以目標語言表示的目標內容。本申請實施例中還提供一種翻譯設備,用于提高翻譯的準確率。
技術領域
本發明涉及計算機領域,尤其涉及一種機器翻譯的方法、設備以及計算機可讀存儲介質。
背景技術
機器翻譯(machine translation,MT)是指使用機器將文本或言語從一種源語言轉化為具有相同含義內容的另一種目標語言的過程。隨著深度學習的興起,最近兩年深層神經網絡技術在MT上也得到應用,神經網絡機器翻譯(neural machine translation,NMT)成為新一代翻譯技術。
目前,NMT使用編碼器-解碼器框架來實現理解語義再翻譯的過程,其中,編碼器用于對輸入端進行編碼,解碼器對輸出端進行解碼,例如,給定一個輸入的源語言句子,首先利用編碼器將它編碼成輸入端的表示向量;然后,在解碼階段,它采用解碼器根據源端的表示向量和當前時刻源端上下文向量每次生成一個新的目標詞。
盡管源語言句子已知,但目標語言的單詞是增量式的產生的,在當前時刻,這個目標單詞是未知的,它需要在下一個時刻之前通過解碼器解碼得到。因此,在解碼器將目源語言與目標語言之間的單詞進行對齊時,很容易出現重復翻譯或漏翻譯的問題,翻譯的準確率下降。
發明內容
本申請實施例提供了一種機器翻譯的方法、設備以及計算機可讀存儲介質,用于提高翻譯的準確率。
第一方面,本申請實施例提供了一種機器翻譯的方法,包括:
接收待處理信息,所述待處理信息以源語言表示;
采用編碼器對所述待處理信息進行編碼處理,生成所述待處理信息的表示向量序列;
通過預測模型預測第一時刻待翻譯的目標展望詞的特征信息,所述目標展望詞以目標語言表示;
根據所述目標展望詞的特征信息確定所述表示向量序列中當前時刻對應的上下文向量;
采用解碼器對所述上下文向量進行解碼處理,得到所述上下文向量對應的以目標語言表示的目標內容。
第二方面,本申請實施例提供了一種翻譯設備,包括:
接收模塊,用于接收待處理信息,所述待處理信息以源語言表示;
編碼模塊,用于采用編碼器對所述接收模塊接收的所述待處理信息進行編碼處理,生成所述待處理信息的表示向量序列;
預測模塊,用于通過預測模型預測第一時刻待翻譯的目標展望詞的特征信息,所述目標展望詞以目標語言表示;
確定模塊,用于根據所述預測模塊預測的所述目標展望詞的特征信息確定所述表示向量序列中當前時刻對應的上下文向量;
解碼模塊,用于采用解碼器對所述確定模塊確定的所述上下文向量進行解碼處理,得到所述上下文向量對應的以目標語言表示的目標內容。
第三方面,本申請實施例提供了一種翻譯設備,包括:
存儲器,用于存儲計算機可執行程序代碼;
網絡接口,以及
處理器,與所述存儲器和所述網絡接口耦合;
其中所述程序代碼包括指令,當所述處理器執行所述指令時,所述指令使所述翻譯設備執行上述第一方面所述的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810131743.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:標題糾錯方法和裝置
- 下一篇:詞嵌入模型的增量生成





