[發(fā)明專利]基于翻譯模型的翻譯方法、裝置及存儲(chǔ)介質(zhì)有效
| 申請(qǐng)?zhí)枺?/td> | 201811539900.8 | 申請(qǐng)日: | 2018-12-17 |
| 公開(kāi)(公告)號(hào): | CN109783824B | 公開(kāi)(公告)日: | 2023-04-18 |
| 發(fā)明(設(shè)計(jì))人: | 畢天馳;張傳強(qiáng);熊皓;何中軍;李芝;王海峰 | 申請(qǐng)(專利權(quán))人: | 北京百度網(wǎng)訊科技有限公司 |
| 主分類號(hào): | G06F40/58 | 分類號(hào): | G06F40/58 |
| 代理公司: | 北京同立鈞成知識(shí)產(chǎn)權(quán)代理有限公司 11205 | 代理人: | 張曉霞;劉芳 |
| 地址: | 100085 北京市*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 翻譯 模型 方法 裝置 存儲(chǔ) 介質(zhì) | ||
1.一種基于翻譯模型的翻譯方法,其特征在于,包括:
獲取待翻譯文本;
將所述待翻譯文本輸入到翻譯模型中,得到翻譯文本;
其中,所述翻譯模型是根據(jù)歷史翻譯文本通過(guò)如下方法訓(xùn)練得到的,所述歷史翻譯文本包括源文本和目標(biāo)文本:
根據(jù)所述源文本、所述目標(biāo)文本,基于教師類-學(xué)生類框架中的多教師類網(wǎng)絡(luò)模型,確定所述多教師類網(wǎng)絡(luò)模型的第一預(yù)測(cè)結(jié)果;
根據(jù)所述源文本、所述目標(biāo)文本,基于所述教師類-學(xué)生類框架中的學(xué)生類網(wǎng)絡(luò)模型,確定所述學(xué)生類網(wǎng)絡(luò)模型的第二預(yù)測(cè)結(jié)果;所述教師類網(wǎng)絡(luò)模型的預(yù)測(cè)精度高于所述學(xué)生類網(wǎng)絡(luò)模型的預(yù)測(cè)精度;
基于所述第一預(yù)測(cè)結(jié)果,通過(guò)迭代方式更新所述第二預(yù)測(cè)結(jié)果,直到更新后的第二預(yù)測(cè)結(jié)果與所述第一預(yù)測(cè)結(jié)果的差異性滿足預(yù)設(shè)誤差,得到翻譯模型。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述源文本、所述目標(biāo)文本,基于所述教師類-學(xué)生類框架中的多教師類網(wǎng)絡(luò)模型,確定所述多教師類網(wǎng)絡(luò)模型的第一預(yù)測(cè)結(jié)果,包括:
將所述源文本輸入到所述多教師類網(wǎng)絡(luò)模型中的每個(gè)教師類網(wǎng)絡(luò)模型中,得到多個(gè)第一預(yù)測(cè)文本;
根據(jù)所述多個(gè)第一預(yù)測(cè)文本和所述目標(biāo)文本,得到所述多教師類網(wǎng)絡(luò)模型的多個(gè)第一預(yù)測(cè)子結(jié)果;
對(duì)所述多個(gè)第一預(yù)測(cè)子結(jié)果進(jìn)行加權(quán)求和,得到所述第一預(yù)測(cè)結(jié)果。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述源文本、所述目標(biāo)文本,基于所述教師類-學(xué)生類框架中的學(xué)生類網(wǎng)絡(luò)模型,確定所述學(xué)生類網(wǎng)絡(luò)模型的第二預(yù)測(cè)結(jié)果,包括:
將所述源文本輸入到所述學(xué)生類網(wǎng)絡(luò)模型中得到第二預(yù)測(cè)文本;
根據(jù)所述第二預(yù)測(cè)文本和所述目標(biāo)文本,得到所述學(xué)生類網(wǎng)絡(luò)模型的第二預(yù)測(cè)結(jié)果。
4.根據(jù)權(quán)利要求1-3任一項(xiàng)所述的方法,其特征在于,所述基于所述第一預(yù)測(cè)結(jié)果,通過(guò)迭代方式更新所述第二預(yù)測(cè)結(jié)果,直到更新后的第二預(yù)測(cè)結(jié)果與所述第一預(yù)測(cè)結(jié)果的差異性滿足預(yù)設(shè)誤差,得到翻譯模型,包括:
對(duì)所述第一預(yù)測(cè)結(jié)果和所述第二預(yù)測(cè)結(jié)果進(jìn)行集成學(xué)習(xí),得到所述多教師類網(wǎng)絡(luò)模型和所述學(xué)生類網(wǎng)絡(luò)模型之間的相對(duì)熵;
根據(jù)所述第二預(yù)測(cè)結(jié)果擬合所述學(xué)生類網(wǎng)絡(luò)模型的有效正確數(shù)據(jù)的損失函數(shù);
根據(jù)所述相對(duì)熵和所述損失函數(shù),采用梯度塊方法迭代更新所述第二預(yù)測(cè)結(jié)果,直到所述相對(duì)熵和所述損失函數(shù)的整體損失小于所述預(yù)設(shè)誤差,得到所述翻譯模型。
5.根據(jù)權(quán)利要求1-3任一項(xiàng)所述的方法,其特征在于,所述獲取待翻譯文本,包括:
獲取用戶通過(guò)人機(jī)交互界面輸入的所述待翻譯文本。
6.根據(jù)權(quán)利要求1-3任一項(xiàng)所述的方法,其特征在于,所述獲取待翻譯文本,包括:
根據(jù)用戶的文本選定指令,從人機(jī)交互界面上獲取所述文本選定指令對(duì)應(yīng)的所述待翻譯文本。
7.一種基于翻譯模型的翻譯裝置,其特征在于,包括:獲取模塊和翻譯模塊;
所述獲取模塊,用于獲取待翻譯文本;
所述翻譯模塊,用于將所述獲取模塊獲取到的待翻譯文本輸入到翻譯模型中,得到翻譯文本;其中,所述翻譯模型是根據(jù)歷史翻譯文本通過(guò)如下方法訓(xùn)練得到的,所述歷史翻譯文本包括源文本和目標(biāo)文本:
所述裝置還包括:訓(xùn)練模塊;所述訓(xùn)練模塊,包括:預(yù)測(cè)單元和確定單元;
所述預(yù)測(cè)單元,用于根據(jù)所述源文本、所述目標(biāo)文本,基于教師類-學(xué)生類框架中的多教師類網(wǎng)絡(luò)模型,確定所述多教師類網(wǎng)絡(luò)模型的第一預(yù)測(cè)結(jié)果,根據(jù)所述源文本、所述目標(biāo)文本,基于所述教師類-學(xué)生類框架中的學(xué)生類網(wǎng)絡(luò)模型,確定所述學(xué)生類網(wǎng)絡(luò)模型的第二預(yù)測(cè)結(jié)果;所述教師類網(wǎng)絡(luò)模型的預(yù)測(cè)精度高于所述學(xué)生類網(wǎng)絡(luò)模型的預(yù)測(cè)精度;
所述確定單元,用于基于所述第一預(yù)測(cè)結(jié)果,通過(guò)迭代方式更新所述第二預(yù)測(cè)結(jié)果,直到更新后的第二預(yù)測(cè)結(jié)果與所述第一預(yù)測(cè)結(jié)果的差異性滿足預(yù)設(shè)誤差,得到翻譯模型。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京百度網(wǎng)訊科技有限公司,未經(jīng)北京百度網(wǎng)訊科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811539900.8/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 一種構(gòu)建多語(yǔ)言網(wǎng)站實(shí)時(shí)翻譯的方法
- 一種待翻譯軟件的翻譯方法及裝置
- 一種待翻譯軟件的翻譯方法及裝置
- 一種CAT系統(tǒng)中翻譯記憶庫(kù)和MT結(jié)合的方法及系統(tǒng)
- 翻譯方法、系統(tǒng)、終端以及存儲(chǔ)介質(zhì)
- 一種文本展示方法及裝置
- 機(jī)器翻譯方法及裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 基于機(jī)器翻譯引擎的翻譯方法及裝置
- 翻譯系統(tǒng)、翻譯方法、翻譯機(jī)及存儲(chǔ)介質(zhì)
- 文字翻譯方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種數(shù)據(jù)庫(kù)讀寫(xiě)分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





