[發明專利]一種翻譯模型的獲取方法、裝置、設備和存儲介質有效
| 申請號: | 201911250280.0 | 申請日: | 2019-12-09 |
| 公開(公告)號: | CN111046677B | 公開(公告)日: | 2021-07-20 |
| 發明(設計)人: | 潘驍;王明軒;李磊 | 申請(專利權)人: | 北京字節跳動網絡技術有限公司 |
| 主分類號: | G06F40/44 | 分類號: | G06F40/44 |
| 代理公司: | 北京遠智匯知識產權代理有限公司 11659 | 代理人: | 范坤坤 |
| 地址: | 100041 北京市石景山區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 翻譯 模型 獲取 方法 裝置 設備 存儲 介質 | ||
1.一種翻譯模型的獲取方法,其特征在于,包括:
獲取多語種平行語料對集合;其中,每個平行語料對包括成對的源語言語料和目標語言語料,所述多語種平行語料對集合包括至少三種平行語料對,每種平行語料對中的源語言和目標語言至少部分不同;所述多語種平行語料對集合中,至少部分平行語料對的源語言語料和/或目標語言語料中,摻雜有其他語言的詞匯;
通過所述多語種平行語料對集合,對通用翻譯模型進行初始訓練,以獲取訓練后的通用翻譯模型;其中,所述通用翻譯模型基于詞匯關聯及語法結構訓練完成;
獲取目標種類的平行語料對集合,并通過所述目標種類的平行語料對集合,對所述訓練后的通用翻譯模型進行定向訓練,以獲取與所述目標種類的語言匹配的目標翻譯模型;其中,所述目標種類的平行語料對集合中各平行語料對之間的源語言相同,目標語言也相同。
2.根據權利要求1所述的方法,其特征在于,所述通用翻譯模型包括序列到序列模型。
3.根據權利要求1所述的方法,其特征在于,所述多語種平行語料對集合中的平行語料對包括文本平行語料對或語音文本語料對。
4.根據權利要求1所述的方法,其特征在于,在獲取目標種類的平行語料對集合后,還包括:
對所述目標種類的平行語料對集合進行噪聲添加操作,以生成包含噪聲的平行語料對;其中,所述噪聲添加操作包括在語料中增加詞匯、刪除詞匯和/或打亂語料中的詞匯順序。
5.根據權利要求1所述的方法,其特征在于,在獲取目標種類的平行語料對集合后,還包括:
對所述目標種類的平行語料對集合中的源語言語料和目標語言語料,分別進行詞序顛倒操作,以獲取新的平行語料對。
6.根據權利要求1所述的方法,其特征在于,所述目標種類的平行語料對集合中,至少部分平行語料對是所述多語種平行語料對集合的子集。
7.一種翻譯模型的獲取裝置,其特征在于,包括:
平行語料獲取模塊,用于獲取多語種平行語料對集合;其中,每個平行語料對包括成對的源語言語料和目標語言語料,所述多語種平行語料對集合包括至少三種平行語料對,每種平行語料對中的源語言和目標語言至少部分不同;所述多語種平行語料對集合中,至少部分平行語料對的源語言語料和/或目標語言語料中,摻雜有其他語言的詞匯;
初始訓練執行模塊,用于通過所述多語種平行語料對集合,對通用翻譯模型進行初始訓練,以獲取訓練后的通用翻譯模型;其中,所述通用翻譯模型基于詞匯關聯及語法結構訓練完成;
定向訓練執行模塊,用于獲取目標種類的平行語料對集合,并通過所述目標種類的平行語料對集合,對所述訓練后的通用翻譯模型進行定向訓練,以獲取與所述目標種類的語言匹配的目標翻譯模型;其中,所述目標種類的平行語料對集合中各平行語料對之間的源語言相同,目標語言也相同。
8.一種電子設備,包括存儲器、處理裝置及存儲在存儲器上并可在處理裝置上運行的計算機程序,其特征在于,所述處理裝置執行所述程序時實現如權利要求1-6中任一所述的翻譯模型的獲取方法。
9.一種包含計算機可執行指令的存儲介質,所述計算機可執行指令在由計算機處理器執行時用于執行如權利要求1-6中任一所述的翻譯模型的獲取方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京字節跳動網絡技術有限公司,未經北京字節跳動網絡技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911250280.0/1.html,轉載請聲明來源鉆瓜專利網。





