[發明專利]基于神經網絡模型的翻譯方法及翻譯系統在審
| 申請號: | 202210184687.3 | 申請日: | 2022-02-28 |
| 公開(公告)號: | CN114510952A | 公開(公告)日: | 2022-05-17 |
| 發明(設計)人: | 余暢;張方元;楊攀;楊尚為;楊子辰 | 申請(專利權)人: | 鹽城睿行空間企業孵化器有限公司 |
| 主分類號: | G06F40/58 | 分類號: | G06F40/58;G06F40/289;G06N3/04 |
| 代理公司: | 北京漢德知識產權代理事務所(普通合伙) 11328 | 代理人: | 錢鶯勤 |
| 地址: | 224200 江蘇省鹽城*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 神經網絡 模型 翻譯 方法 系統 | ||
基于神經網絡模型的翻譯方法,包括下列步驟:構建編碼器?解碼器網絡架構的神經網絡翻譯模型。利用編碼器將原文編碼。解碼器在解碼位置生成Beam的過程中利用注意力機制判斷當前解碼位置是否對齊到帶術語的原文。若是則采用Dynamic Beam Allocation算法的動態分配機制生成當前位置的Beam,并且僅分配對應原文術語的譯文。若否則采用Beam Search算法生成當前位置的Beam。利用解碼器從最后一個Beam回溯全部路徑,選取評分最高的路徑,將路徑上的候選詞連接在一起生成譯文。該翻譯方法能夠根據術語表提供譯文,并兼顧翻譯的效率和質量。本發明還提供了一種采用上述翻譯方法的翻譯系統。
技術領域
本發明涉及一種翻譯方法,尤其涉及一種基于神經網絡模型的翻譯方法。本發明還涉及一種采用上述翻譯方法的翻譯系統。
背景技術
當前多數機器翻譯引擎基于神經網絡模型構建,采用編碼器-解碼器(Encoder-Decoder)框架,其中編碼器(Encoder)將原文中的詞(子詞)編碼為向量,解碼器(Decoder)接收編碼器編碼的信息,加上注意力機制,結合解碼器已輸出的譯文向量,使用集束搜索(Beam Search)算法輸出譯文。由于目前的機器翻譯技術是按句子來翻譯的,因此無法保證原文中的術語在不同句子中得到準確一致的翻譯。為解決上述問題,提出了一種新的算法動態束分配(Dynamic Beam Allocation,DBA),然而DBA算法的缺陷在于固定大小的Beam中的可分配空間有限,而束(Beam)中被分配的術語詞過多,限制了模型的輸出能力,影響了輸出譯文的質量。
發明內容
本發明的目的是提供一種基于神經網絡模型的翻譯方法,能夠根據術語表提供譯文,并兼顧翻譯的效率和質量。
本發明的另一個目的是提供一種基于神經網絡模型的翻譯系統,能夠根據術語表提供譯文,并兼顧翻譯的效率和質量。
本發明提供了一種基于神經網絡模型的翻譯方法,包括下列步驟:
構建編碼器-解碼器網絡架構的神經網絡翻譯模型;
利用編碼器將原文編碼為編碼向量;
解碼器在解碼位置利用編碼向量生成Beam的過程中利用注意力機制輸出對齊分數,判斷當前解碼位置是否對齊到帶術語的原文位置;
若是則解碼器在解碼位置采用Dynamic Beam Allocation算法的動態分配機制生成當前位置的Beam,并且僅分配對應原文術語的譯文;
若否則解碼器在解碼位置則采用Beam Search算法生成當前位置的Beam;
利用解碼器從最后一個Beam回溯全部路徑,選取評分最高的路徑,將路徑上的候選詞連接在一起生成譯文。
本發明提供的基于神經網絡模型的翻譯方法,在解碼器解碼過程中,利用注意力機制生成對齊信息,預判用戶指定的術語譯文的輸出位置,優化了Dynamic BeamAllocation 算法的Beam分配機制,在不降低解碼速度的前提下,提升了Dynamic BeamAllocation 算法的譯文輸出質量。借此使機器翻譯引擎能夠根據術語表提供譯文,并兼顧翻譯的效率和質量。
在基于神經網絡模型的翻譯方法的一種示意性方式中,利用如下公式計算注意力機制的對齊分數:
其中,n表示編碼器輸出的編碼向量的維度,hi表示編碼器在i位置輸出的編碼向量,St表示解碼器在t位置的編碼向量。
在基于神經網絡模型的翻譯方法的一種示意性方式中,Dynamic BeamAllocation算法的動態分配機包括步驟:
生成候選詞集合,候選詞集合包括采用Beam Search算法在上一個Beam生成的數個候選詞結果、所有當前解碼路徑未覆蓋的術語起始詞和術語表中前一位置候選詞的接續詞;以及
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于鹽城睿行空間企業孵化器有限公司,未經鹽城睿行空間企業孵化器有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210184687.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:頭戴顯示設備及其散熱方法
- 下一篇:一種安裝動力裝置的框架結構及工程機械





