[發(fā)明專利]一種機器翻譯的方法、設備以及計算機可讀存儲介質有效
| 申請?zhí)枺?/td> | 201810131743.0 | 申請日: | 2018-02-08 |
| 公開(公告)號: | CN110134971B | 公開(公告)日: | 2022-12-16 |
| 發(fā)明(設計)人: | 劉樂茂;李昕同;史樹明 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F40/58 | 分類號: | G06F40/58;G06F40/268 |
| 代理公司: | 深圳市深佳知識產權代理事務所(普通合伙) 44285 | 代理人: | 王仲凱 |
| 地址: | 518057 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 機器翻譯 方法 設備 以及 計算機 可讀 存儲 介質 | ||
1.一種機器翻譯的方法,其特征在于,包括:
接收待處理信息,所述待處理信息以源語言表示;
采用編碼器對所述待處理信息進行編碼處理,生成所述待處理信息的表示向量序列;
采用神經網絡模型根據第二時刻對應的目標內容得到第一結果,所述第二時刻為第一時刻之前的相鄰時刻,所述第一結果為所述神經網絡模型的隱含單元在第一時刻的隱含狀態(tài);
通過預測模型根據所述第一結果預測第一時刻待翻譯的目標展望詞的特征信息,所述目標展望詞以目標語言表示;
根據所述目標展望詞的特征信息確定所述表示向量序列中當前時刻對應的上下文向量;
采用解碼器對所述上下文向量進行解碼處理,得到所述上下文向量對應的以目標語言表示的目標內容。
2.根據權利要求1所述的方法,其特征在于,所述通過預測模型預測第一時刻待翻譯的目標展望詞的特征信息之前,所述方法還包括:
根據數據集合中的信息訓練所述預測模型,所述數據集合包括源語言語句,與所述源語言語句對應的目標語言語句,及所述目標語言語句的特征信息。
3.根據權利要求1所述的方法,其特征在于,所述根據所述目標展望詞的特征信息確定所述表示向量序列中第一時刻對應的上下文向量,包括:
獲取所述目標展望詞的特征信息;
對所述目標展望詞的特征信息進行估計,得到估計結果;
根據所述估計結果確定所述表示向量序列中第一時刻對應的上下文向量。
4.根據權利要求1所述的方法,其特征在于,所述采用神經網絡模型根據第二時刻對應的目標內容得到第一結果,包括:
采用所述神經網絡模型根據所述第二時刻對應的目標內容和第一時刻的單詞向量得到所述第一結果,所述單詞向量為所述表示向量序列中按照詞組順序進行表示的向量。
5.一種翻譯設備,其特征在于,包括:
接收模塊,用于接收待處理信息,所述待處理信息以源語言表示;
編碼模塊,用于采用編碼器對所述接收模塊接收的所述待處理信息進行編碼處理,生成所述待處理信息的表示向量序列;
預測模塊,用于采用神經網絡模型根據第二時刻對應的目標內容得到第一結果,所述第二時刻為第一時刻之前的相鄰時刻,所述第一結果為所述神經網絡模型的隱含單元在第一時刻的隱含狀態(tài);通過預測模型根據所述第一結果預測第一時刻待翻譯的目標展望詞的特征信息,所述目標展望詞以目標語言表示;
確定模塊,用于根據所述預測模塊預測的所述目標展望詞的特征信息確定所述表示向量序列中當前時刻對應的上下文向量;
解碼模塊,用于采用解碼器對所述確定模塊確定的所述上下文向量進行解碼處理,得到所述上下文向量對應的以目標語言表示的目標內容。
6.根據權利要求5所述的翻譯設備,其特征在于,還包括模型訓練模塊;
所述模型訓練模塊,用于根據數據集合中的信息訓練所述預測模型,所述數據集合包括源語言語句,與所述源語言語句對應的目標語言語句,及所述目標語言語句的特征信息。
7.根據權利要求5所述的翻譯設備,其特征在于,所述確定模塊包括獲取單元、估計單元和確定單元;
所述獲取單元,用于獲取所述目標展望詞的特征信息;
所述估計單元,擁有對所述獲取單元獲取的所述目標展望詞的特征信息進行估計,得到估計結果;
所述確定單元,用于根據所述估計單元估計的估計結果確定所述表示向量序列中第一時刻對應的上下文向量。
8.一種翻譯設備,其特征在于,包括:
存儲器,用于存儲計算機可執(zhí)行程序代碼;
網絡接口,以及
處理器,與所述存儲器和所述網絡接口耦合;
其中所述程序代碼包括指令,當所述處理器執(zhí)行所述指令時,所述指令使所述翻譯設備執(zhí)行如權利要求1-4中任一項所述的方法。
9.一種計算機可讀存儲介質,其特征在于,用于儲存翻譯設備所用的計算機軟件指令,其包含用于執(zhí)行如權利要求1-4中任一項的方法中所設計的程序。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810131743.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:標題糾錯方法和裝置
- 下一篇:詞嵌入模型的增量生成





