[發明專利]翻譯模型的訓練與翻譯方法、裝置有效
| 申請號: | 202110736621.6 | 申請日: | 2021-06-30 |
| 公開(公告)號: | CN113408303B | 公開(公告)日: | 2022-06-28 |
| 發明(設計)人: | 王曦陽;張睿卿;何中軍;李芝;吳華 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06F40/58 | 分類號: | G06F40/58;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京鴻德海業知識產權代理有限公司 11412 | 代理人: | 田宏賓 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 翻譯 模型 訓練 方法 裝置 | ||
本公開提供了一種翻譯模型的訓練與翻譯方法、裝置,涉及自然語言處理、深度學習技術領域。翻譯模型的訓練方法包括:獲取第一訓練數據;構建包含記憶模塊、編碼模塊與解碼模塊的神經網絡模型;使用多個第一訓練文本、多個第一訓練文本的前文文本與多個第一訓練文本的譯文標注結果訓練神經網絡模型,得到翻譯模型。翻譯方法包括:獲取待翻譯篇章,確定待翻譯篇章中的待翻譯文本與待翻譯文本的前文文本;針對每個待翻譯文本,將該待翻譯文本與該待翻譯文本的前文文本輸入翻譯模型,根據翻譯模型的輸出結果得到待翻譯文本的譯文輸出結果;根據每個待翻譯文本的譯文輸出結果,得到待翻譯篇章的翻譯結果。
技術領域
本公開涉及計算機技術領域,尤其涉及自然語言處理、深度學習技術領域。提供了一種翻譯模型的訓練與翻譯方法、裝置、電子設備和可讀存儲介質。
背景技術
在機器翻譯中,通常以句子為單位輸入翻譯系統進行翻譯,然后得到由翻譯系統所產出的譯文。而在真實的翻譯場景中,句子之間并不是相互獨立的,而是存在著上下文關系。只針對句子級別的翻譯系統所產出的譯文可能在單句層面上是完美的,但是從句子所在的整個語境層面上看,逐句翻譯的結果不一定是最優的。
發明內容
根據本公開的第一方面,提供了一種翻譯模型的訓練方法,包括:獲取第一訓練數據,所述第一訓練數據中包含多個第一訓練文本、多個第一訓練文本的前文文本與多個第一訓練文本的譯文標注結果;構建包含記憶模塊、編碼模塊與解碼模塊的神經網絡模型,所述記憶模塊用于根據當前的記憶向量與所述編碼模塊得到的第一編碼向量,輸出更新后的記憶向量與用于輸入所述解碼模塊的第二編碼向量;使用多個第一訓練文本、多個第一訓練文本的前文文本與多個第一訓練文本的譯文標注結果訓練所述神經網絡模型,得到翻譯模型。
根據本公開的第二方面,提供了一種翻譯方法,包括:獲取待翻譯篇章,確定所述待翻譯篇章中的待翻譯文本與所述待翻譯文本的前文文本;針對每個待翻譯文本,將該待翻譯文本與該待翻譯文本的前文文本輸入翻譯模型,根據所述翻譯模型的輸出結果得到所述待翻譯文本的譯文輸出結果;根據每個待翻譯文本的譯文輸出結果,得到所述待翻譯篇章的翻譯結果。
根據本公開的第三方面,提供了一種翻譯模型的訓練裝置,包括:第一獲取單元,用于獲取第一訓練數據,所述第一訓練數據中包含多個第一訓練文本、多個第一訓練文本的前文文本與多個第一訓練文本的譯文標注結果;構建單元,用于構建包含記憶模塊、編碼模塊與解碼模塊的神經網絡模型,所述記憶模塊用于根據當前的記憶向量與所述編碼模塊得到的第一編碼向量,輸出更新后的記憶向量與用于輸入所述解碼模塊的第二編碼向量;訓練單元,用于使用多個第一訓練文本、多個第一訓練文本的前文文本與多個第一訓練文本的譯文標注結果訓練所述神經網絡模型,得到翻譯模型。
根據本公開的第四方面,提供了一種翻譯裝置,包括:第二獲取單元,用于獲取待翻譯篇章,確定所述待翻譯篇章中的待翻譯文本與所述待翻譯文本的前文文本;翻譯單元,用于針對每個待翻譯文本,將該待翻譯文本與該待翻譯文本的前文文本輸入翻譯模型,根據所述翻譯模型的輸出結果得到所述待翻譯文本的譯文輸出結果;處理單元,用于根據每個待翻譯文本的譯文輸出結果,得到所述待翻譯篇章的翻譯結果。
根據本公開的第五方面,提供了一種電子設備,包括:至少一個處理器;以及與所述至少一個處理器通信連接的存儲器;其中,所述存儲器存儲有可被所述至少一個處理器執行的指令,所述指令被所述至少一個處理器執行,以使所述至少一個處理器能夠執行如上所述的方法。
根據本公開的第六方面,提供了一種存儲有計算機指令的非瞬時計算機可讀存儲介質,其中,所述計算機指令用于使所述計算機執行如上所述的方法。
根據本公開的第七方面,提供了一種計算機程序產品,包括計算機程序,所述計算機程序在被處理器執行時實現如上所述的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110736621.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種超薄規格65Mn冷軋寬鋼帶及其制造方法
- 下一篇:一種顯示裝置





