[發明專利]翻譯模型的訓練方法和裝置有效
| 申請號: | 201910380016.2 | 申請日: | 2019-05-08 |
| 公開(公告)號: | CN110162800B | 公開(公告)日: | 2021-02-05 |
| 發明(設計)人: | 畢天馳;張傳強;徐梓翔;熊皓;何中軍;李芝 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06F40/58 | 分類號: | G06F40/58;G06F40/44 |
| 代理公司: | 北京清亦華知識產權代理事務所(普通合伙) 11201 | 代理人: | 宋合成 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 翻譯 模型 訓練 方法 裝置 | ||
本申請提出一種翻譯模型的訓練方法和裝置,其中,方法包括:獲取源語言樣本;將源語言樣本分別輸入模型結構不同的多個翻譯模型,以得到各翻譯模型輸出的目標語言樣本;根據各翻譯模型輸出的目標語言樣本,確定目標譯文;根據目標譯文與各翻譯模型輸出的目標語言樣本之間的差異性,對相應的翻譯模型進行訓練。該方法能夠實現在訓練時,利用多個翻譯模型進行聯合學習,以產生高質量的語音翻譯結果,緩解單一模型輸出質量較差的問題,提升翻譯模型的翻譯性能。
技術領域
本申請涉及機器學習技術領域,尤其涉及一種翻譯模型的訓練方法和裝置。
背景技術
目前,端到端語音翻譯模型均采用一個單一模型進行訓練,在語音翻譯時,利用單一模型將一種語言的語音信號,翻譯為另一種語言的文本信息。由于單一模型受限于模型和訓練語料的規模,難以產生高質量的翻譯結果。
發明內容
本申請提出一種翻譯模型的訓練方法和裝置,以實現在訓練時,利用多個翻譯模型進行聯合學習,以產生高質量的語音翻譯結果,緩解單一模型輸出質量較差的問題,提升翻譯模型的翻譯性能,用于解決現有技術中單一模型的性能無法得到保障,容易產生質量較差的譯文的技術問題。
本申請第一方面實施例提出了一種翻譯模型的訓練方法,包括:
獲取源語言樣本;
將所述源語言樣本分別輸入模型結構不同的多個翻譯模型,以得到各翻譯模型輸出的目標語言樣本;
根據各翻譯模型輸出的目標語言樣本,確定目標譯文;
根據所述目標譯文與各翻譯模型輸出的目標語言樣本之間的差異性,對相應的翻譯模型進行訓練。
本申請實施例的翻譯模型的訓練方法,通過獲取源語言樣本,并將源語言樣本分別輸入模型結構不同的多個翻譯模型,以得到各翻譯模型輸出的目標語言樣本,之后,根據各翻譯模型輸出的目標語言樣本,確定目標譯文,最后,根據目標譯文與各翻譯模型輸出的目標語言樣本之間的差異性,對相應的翻譯模型進行訓練。本申請中,根據與多個翻譯模型輸出結果相關的目標譯文,對各翻譯模型進行訓練,可以實現在訓練時,利用多個翻譯模型進行聯合學習,以產生高質量的語音翻譯結果,緩解單一模型輸出質量較差的問題,提升翻譯模型的翻譯性能。
本申請第二方面實施例提出了一種翻譯模型的訓練裝置,包括:
獲取模塊,用于獲取源語言樣本;
處理模塊,用于將所述源語言樣本分別輸入模型結構不同的多個翻譯模型,以得到各翻譯模型輸出的目標語言樣本;
確定模塊,用于根據各翻譯模型輸出的目標語言樣本,確定目標譯文;
訓練模塊,用于根據所述目標譯文與各翻譯模型輸出的目標語言樣本之間的差異性,對相應的翻譯模型進行訓練。
本申請實施例的翻譯模型的訓練裝置,通過獲取源語言樣本,并將源語言樣本分別輸入模型結構不同的多個翻譯模型,以得到各翻譯模型輸出的目標語言樣本,之后,根據各翻譯模型輸出的目標語言樣本,確定目標譯文,最后,根據目標譯文與各翻譯模型輸出的目標語言樣本之間的差異性,對相應的翻譯模型進行訓練。本申請中,根據與多個翻譯模型輸出結果相關的目標譯文,對各翻譯模型進行訓練,可以實現在訓練時,利用多個翻譯模型進行聯合學習,以產生高質量的語音翻譯結果,緩解單一模型輸出質量較差的問題,提升翻譯模型的翻譯性能。
本申請第三方面實施例提出了一種電子設備,包括:存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,所述處理器執行所述程序時,實現如本申請第一方面實施例提出的翻譯模型的訓練方法。
本申請第四方面實施例提出了一種計算機可讀存儲介質,其上存儲有計算機程序,該程序被處理器執行時實現如本申請第一方面實施例提出的翻譯模型的訓練方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910380016.2/2.html,轉載請聲明來源鉆瓜專利網。





