[發明專利]用于翻譯語句的方法和裝置有效
| 申請號: | 201811543684.4 | 申請日: | 2018-12-17 |
| 公開(公告)號: | CN109558605B | 公開(公告)日: | 2022-06-10 |
| 發明(設計)人: | 畢天馳;張傳強;熊皓;何中軍;李芝;王海峰 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06F40/58 | 分類號: | G06F40/58 |
| 代理公司: | 北京英賽嘉華知識產權代理有限責任公司 11204 | 代理人: | 王達佐;馬曉亞 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 翻譯 語句 方法 裝置 | ||
本申請實施例公開了用于生成翻譯模型的方法和裝置。該方法的一具體實施方式包括:基于將訓練樣本輸入正向編碼器和正向解碼器所得到的正向翻譯語句切分詞概率序列,和將訓練樣本輸入反向編碼器和反向解碼器所得到的反向翻譯語句切分詞概率序列確定總損失值,并在確定模型未訓練完成時,調整正向編碼器、正向解碼器、反向編碼器和反向解碼器的模型參數直到確定模型訓練完成。該實施方式降低了翻譯過程中前面翻譯錯誤對后面翻譯所造成的影響。
技術領域
本申請實施例涉及計算機技術領域,具體涉及用于翻譯語句的方法和裝置。
背景技術
目前大都采用神經機器翻譯來實現機器翻譯。神經機器翻譯包括一個編碼器和一個解碼器。將待翻譯語句輸入編碼器進行編碼成得到語義向量,再由解碼器將語義向量解碼就得到翻譯結果。現有的編碼器和解碼器基本是適合處理時序數據的神經網絡。然而,現有的神經機器翻譯,基本是前面已經翻譯出來的詞會影響到后續的翻譯結果,如果前面翻譯錯了,那么后面的翻譯效果將會收到前面翻譯錯誤的影響。
發明內容
本申請實施例提出了用于生成翻譯模型的方法和裝置以及用于翻譯語句的方法和裝置。
第一方面,本申請實施例提供了一種用于生成翻譯模型的方法,該方法包括:獲取訓練樣本集,其中,訓練樣本包括源語言的源語句切分詞序列以及具有相同語義的目標語言的目標語句切分詞序列;確定初始翻譯模型,初始翻譯模型包括正向編碼器、正向解碼器、反向編碼器和反向解碼器;對于訓練樣本集中的訓練樣本,執行以下輸入步驟:將該訓練樣本中的源語句切分詞序列分別輸入正向編碼器和反向編碼器,得到第一語義向量和第二語義向量;將所得到的第一語義向量和該訓練樣本中的目標語句切分詞序列輸入正向解碼器得到正向翻譯語句切分詞概率序列;將所得的第二語義向量和該訓練樣本中的目標語句切分詞序列的反向序列輸入反向解碼器得到反向翻譯語句切分詞概率序列;執行以下損失值確定步驟:基于訓練樣本集中訓練樣本對應的正向翻譯語句切分詞概率序列和反向翻譯語句切分詞概率序列確定總損失值;利用機器學習方法調整初始翻譯模型的模型參數后再次執行輸入步驟和損失值確定步驟,直到根據總損失值和損失值閾值的比較結果確定模型訓練完成,將初始翻譯模型確定為所生成的翻譯模型。
在一些實施例中,將所得到的第一語義向量和該訓練樣本中的目標語句切分詞序列輸入正向解碼器得到正向翻譯語句切分詞概率序列,包括:將所得到的第一語義向量和該訓練樣本中的目標語句切分詞序列輸入正向解碼器,得到正向翻譯語句切分詞概率分布矩陣,正向翻譯語句切分詞概率分布矩陣用于表征正向翻譯語句中每個切分詞是預設切分詞表中各個切分詞的概率值;用所得到的正向翻譯語句切分詞概率分布矩陣中每個切分詞屬于預設切分詞表中各個切分詞的概率值中的最大值所對應的切分詞和相應的概率值生成正向翻譯語句切分詞概率序列。
在一些實施例中,將所得的第二語義向量和該訓練樣本中的目標語句切分詞序列的反向序列輸入反向解碼器得到反向翻譯語句切分詞概率序列,包括:將所得的第二語義向量和該訓練樣本中的目標語句切分詞序列的反向序列輸入反向解碼器,得到反向翻譯語句切分詞概率分布矩陣,反向翻譯語句切分詞概率分布矩陣用于表征反向翻譯語句中每個切分詞是預設切分詞表中每個切分詞的概率值;用所得到的反向翻譯語句切分詞概率分布矩陣中每個切分詞屬于預設切分詞表中每個切分詞的概率值中的最大值所對應的切分詞和相應的概率值生成反向翻譯語句切分詞概率序列。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811543684.4/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種機器翻譯方法、裝置、電子設備及存儲介質
- 下一篇:BIM招投標系統





