[發明專利]一種文本翻譯方法及裝置有效
| 申請號: | 202010192658.2 | 申請日: | 2018-11-30 |
| 公開(公告)號: | CN111428520B | 公開(公告)日: | 2021-11-23 |
| 發明(設計)人: | 涂兆鵬;竇子軼;王星;王龍躍;史樹明;張潼 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F40/58 | 分類號: | G06F40/58;G06N3/04;G06N3/08 |
| 代理公司: | 北京同達信恒知識產權代理有限公司 11291 | 代理人: | 李娟 |
| 地址: | 518044 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 文本 翻譯 方法 裝置 | ||
本申請實施例提供了一種文本翻譯方法及裝置,涉及人工智能中的機器學習技術領域,在對待翻譯文本進行翻譯時,采用編碼器對待翻譯文本進行編碼,將編碼器中每個隱藏層的處理結果進行融合,確定源端向量表示序列。之后解碼器對源端向量表示序列進行解碼,將解碼器中每個隱藏層的處理結果進行融合確定翻譯后的文本信息,以學習更好的隱層表示,減少有用信息的丟失,從而提高了翻譯的準確性。編碼器和解碼器根據各隱藏層的輸出結果確定各隱藏層的融合權重,然后基于融合權重對各隱藏層的輸出結果進行融合,故針對不同的待翻譯文本,編碼器和解碼器中各隱藏層的權重也不相同,從而提高了編碼器和解碼器的表達能力,提高了翻譯的穩定性。
技術領域
本申請實施例涉及人工智能中的機器學習技術領域,尤其涉及一種文本翻譯方法及裝置。
背景技術
機器翻譯(Machine Translation,MT)是指使用機器將文本或言語從一種語言轉化為具有相同含義內容的另一種語言的過程。隨著深度學習的興起,最近幾年深層神經網絡技術在MT上也得到應用,神經網絡機器翻譯(Neural Machine Translation,NMT)成為新一代翻譯技術。
目前,NMT普遍使用的模型由一個多層神經網絡的編碼器和一個多層神經網絡的解碼器組成。然而,在使用該模型實現翻譯時,僅僅利用了編碼器最上層的信息和解碼器最上層的信息,從而忽略了蘊含在其它層中的信息。
發明內容
由于現有技術中,NMT使用編碼器-解碼器模型翻譯文本時,僅利用了編碼器最上層的信息和解碼器最上層的信息,從而忽略了蘊含在其它層中的信息的問題,本申請實施例提供了一種文本翻譯方法及裝置。
一方面,本申請實施例提供了一種文本翻譯方法,該方法包括:
獲得編碼器各隱藏層對待翻譯文本進行編碼后的編碼序列;
根據所述編碼器各隱藏層的編碼權重將各個編碼序列進行融合,獲得源端向量表示序列,其中,所述編碼器各隱藏層的編碼權重是在訓練所述編碼器的過程中,學習不同翻譯文本樣本在兩種語言之間進行翻譯的過程而獲得的;
獲得解碼器各隱藏層對所述源端向量表示序列進行解碼后的解碼序列;
根據所述解碼器各隱藏層的解碼權重將各個解碼序列進行融合,獲得解碼向量表示序列,其中,所述解碼器各隱藏層的解碼權重是在訓練所述解碼器的過程中,學習不同翻譯文本樣本在兩種語言之間進行翻譯的過程而獲得的;
根據所述解碼向量表示序列,確定翻譯后的文本信息。
另一方面,本申請實施例提供了一種文本翻譯裝置,該裝置包括:
編碼模塊,用于獲得編碼器各隱藏層對待翻譯文本進行編碼后的編碼序列;
第一融合模塊,用于根據所述編碼器各隱藏層的編碼權重將各個編碼序列進行融合,獲得源端向量表示序列,其中,所述編碼器各隱藏層的編碼權重是在訓練所述編碼器的過程中,學習不同翻譯文本樣本在兩種語言之間進行翻譯的過程而獲得的;
解碼模塊,用于獲得解碼器各隱藏層對所述源端向量表示序列進行解碼后的解碼序列;
第二融合模塊,用于根據所述解碼器各隱藏層的解碼權重將各個解碼序列進行融合,獲得解碼向量表示序列,其中,所述解碼器各隱藏層的解碼權重是在訓練所述解碼器的過程中,學習不同翻譯文本樣本在兩種語言之間進行翻譯的過程而獲得的;
匹配模塊,用于根據所述解碼向量表示序列,確定翻譯后的文本信息。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010192658.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種基于DNS分析的主機失陷檢測方法及裝置
- 下一篇:數據的處理方法和裝置





