[發(fā)明專利]翻譯模型訓(xùn)練的方法、語句翻譯的方法、設(shè)備及存儲介質(zhì)有效
| 申請?zhí)枺?/td> | 201810445783.2 | 申請日: | 2018-05-10 |
| 公開(公告)號: | CN110472251B | 公開(公告)日: | 2023-05-30 |
| 發(fā)明(設(shè)計)人: | 程勇;涂兆鵬;孟凡東;翟俊杰;劉洋 | 申請(專利權(quán))人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F40/58 | 分類號: | G06F40/58;G06F40/30 |
| 代理公司: | 深圳市深佳知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 44285 | 代理人: | 王仲凱 |
| 地址: | 518057 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 翻譯 模型 訓(xùn)練 方法 語句 設(shè)備 存儲 介質(zhì) | ||
本申請公開了一種翻譯模型訓(xùn)練的方法,包括:獲取訓(xùn)練樣本集合,訓(xùn)練樣本集合中包括多個訓(xùn)練樣本;確定訓(xùn)練樣本集合中每個訓(xùn)練樣本各自對應(yīng)的擾動樣本集合,擾動樣本集合包括至少一個擾動樣本,擾動樣本與對應(yīng)訓(xùn)練樣本的語義相似度高于第一預(yù)設(shè)值;使用多個訓(xùn)練樣本和每個訓(xùn)練樣本各自對應(yīng)的擾動樣本集合訓(xùn)練初始翻譯模型,以得到目標(biāo)翻譯模型。本申請實施例提供的方案在模型訓(xùn)練是引入了擾動樣本,所以可以提高機(jī)器翻譯的魯棒性,以及翻譯質(zhì)量。
技術(shù)領(lǐng)域
本申請涉及計算機(jī)技術(shù)領(lǐng)域,具體涉及一種翻譯模型訓(xùn)練的方法、語句翻譯的方法、計算機(jī)設(shè)備、終端設(shè)備及計算機(jī)可讀存儲介質(zhì)。
背景技術(shù)
隨著人工智能的發(fā)展,機(jī)器翻譯已經(jīng)被廣泛使用,如同聲傳譯和聊天內(nèi)容翻譯等,都是基于機(jī)器翻譯將一種輸入語言轉(zhuǎn)換為另一種語言輸出。
神經(jīng)機(jī)器翻譯是一種完全基于神經(jīng)網(wǎng)絡(luò)的機(jī)器翻譯模型,其在諸多語言對上已經(jīng)達(dá)到了很好的翻譯水平,已被廣泛的應(yīng)用在各種機(jī)器翻譯產(chǎn)品中。然而,由于神經(jīng)機(jī)器翻譯模型基于一個完整的神經(jīng)網(wǎng)絡(luò),其建模的全局性導(dǎo)致目標(biāo)端的每個輸出依賴于源端輸入的每個詞,使得對于輸入中的微小擾動過度敏感。例如,在中文到英文得翻譯中,用戶輸入“他們不怕困難做出圍棋AI”,機(jī)器翻譯模型給出的英文翻譯為“They?are?not?afraid?ofdifficulties?to?make?Go?AI”,然而,當(dāng)用戶輸入一個相似的語句“他們不畏困難做出圍棋AI”,機(jī)器翻譯的輸出發(fā)生了劇烈改變,結(jié)果為“They?are?not?afraid?to?make?Go?AI”,盡管用戶只是用近義詞替換了其中一個詞,但其翻譯結(jié)果卻發(fā)生了劇烈變化。
由此可見,目前的神經(jīng)機(jī)器翻譯的穩(wěn)定性,也就是魯棒性比較差。
發(fā)明內(nèi)容
本申請實施例提供一種翻譯模型訓(xùn)練的方法,可以提高機(jī)器翻譯的魯棒性,以及翻譯質(zhì)量。本申請實施例還提供了相應(yīng)的語句翻譯的方法、計算機(jī)設(shè)備、終端設(shè)備以及計算機(jī)可讀存儲介質(zhì)。
本申請第一方面提供一種翻譯模型訓(xùn)練的方法,包括:
獲取訓(xùn)練樣本集合,所述訓(xùn)練樣本集合中包括多個訓(xùn)練樣本;
確定所述訓(xùn)練樣本集合中每個訓(xùn)練樣本各自對應(yīng)的擾動樣本集合,所述擾動樣本集合包括至少一個擾動樣本,所述擾動樣本與對應(yīng)訓(xùn)練樣本的語義相似度高于第一預(yù)設(shè)值;
使用所述多個訓(xùn)練樣本和所述每個訓(xùn)練樣本各自對應(yīng)的擾動樣本集合訓(xùn)練初始翻譯模型,以得到目標(biāo)翻譯模型。
本申請第二方面提供一種語句翻譯的方法,包括:
接收以第一語言表達(dá)的第一待翻譯語句;
使用目標(biāo)翻譯模型對所述第一待翻譯語句進(jìn)行翻譯,以得到用第二語言表達(dá)的翻譯結(jié)果語句,其中所述目標(biāo)翻譯模型為使用多個訓(xùn)練樣本和所述多個訓(xùn)練樣本中每個訓(xùn)練樣本各自對應(yīng)的擾動樣本集合訓(xùn)練得到的,所述擾動樣本集合包括至少一個擾動樣本,所述擾動樣本與對應(yīng)訓(xùn)練樣本的語義相似度高于第一預(yù)設(shè)值;
輸出所述用第二語言表達(dá)的翻譯結(jié)果語句。
本申請第三方面提供一種翻譯模型訓(xùn)練的裝置,包括:
獲取單元,用于獲取訓(xùn)練樣本集合,所述訓(xùn)練樣本集合中包括多個訓(xùn)練樣本;
確定單元,用于確定所述獲取單元獲取的所述訓(xùn)練樣本集合中每個訓(xùn)練樣本各自對應(yīng)的擾動樣本集合,所述擾動樣本集合包括至少一個擾動樣本,所述擾動樣本與對應(yīng)訓(xùn)練樣本的語義相似度高于第一預(yù)設(shè)值;
模型訓(xùn)練單元,用于使用所述獲取單元獲得的所述多個訓(xùn)練樣本和所述確定單元確定的所述每個訓(xùn)練樣本各自對應(yīng)的擾動樣本集合訓(xùn)練初始翻譯模型,以得到目標(biāo)翻譯模型。
本申請第四方面提供一種語句翻譯的裝置,包括:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于騰訊科技(深圳)有限公司,未經(jīng)騰訊科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810445783.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





