[發明專利]一種文字翻譯方法、裝置、電子設備及存儲介質在審
| 申請號: | 202310476522.8 | 申請日: | 2023-04-28 |
| 公開(公告)號: | CN116663576A | 公開(公告)日: | 2023-08-29 |
| 發明(設計)人: | 沙露露 | 申請(專利權)人: | 珠海億智電子科技有限公司 |
| 主分類號: | G06F40/58 | 分類號: | G06F40/58;G06F40/205;G06F16/35;G06F18/214;G06F18/241 |
| 代理公司: | 深圳青年人專利商標代理有限公司 44350 | 代理人: | 吳桂華 |
| 地址: | 519000 廣東省珠海市高新區*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 文字 翻譯 方法 裝置 電子設備 存儲 介質 | ||
1.一種文字翻譯方法,其特征在于,包括:
獲取預設訓練集,所述訓練集內包括原文及其譯文所組成的平行語料;
對所述預設訓練集內的平行語料進行兩次篩選處理,得到目標訓練集;
將所述目標訓練集導入預設翻譯模型,對所述預設翻譯模型進行訓練,得到目標模型,所述預設翻譯模型基于標準Transformer模型構建;
將待翻譯數據輸入所述目標模型,得到翻譯結果。
2.如權利要求1所述的文字翻譯方法,其特征在于,所述對所述預設訓練集內的平行語料進行兩次篩選處理,得到目標訓練集的步驟,包括:
基于標準Transformer模型的歷史翻譯數據確定文字翻譯過程中發生概率大于等于閾值的錯誤事件,并分析所述錯誤事件中的原文及其譯文的特征規律;
基于所述特征規律對所述預設訓練集內的平行語料進行篩選處理,得到初始訓練集;
基于所述初始訓練集和標準Transformer模型對所述初始訓練集進行篩選,得到所述目標訓練集。
3.如權利要求2所述的文字翻譯方法,其特征在于,所述基于所述初始訓練集和標準Transformer模型對所述初始訓練集進行篩選,得到所述目標訓練集的步驟,包括:
基于所述初始訓練集訓練所述標準Transformer模型;
將所述初始訓練集中的目標譯文輸入訓練后的標準Transformer模型,得到翻譯文;
計算所述翻譯文和所述初始訓練集中與所述目標譯文對應的目標原文的相似度,基于所述相似度對所述初始訓練集進行篩選,得到所述目標訓練集。
4.如權利要求1所述的文字翻譯方法,其特征在于,在所述將所述目標訓練集導入預設翻譯模型,完成對所述預設翻譯模型的訓練,得到目標模型的步驟之前,還包括:
獲取所述標準Transformer模型的基礎信息,所述基礎信息包括結構數據和維度數據;
根據所述結構數據中編碼器層的數量和解碼器層的數量確定所述預設翻譯模型的目標結構中目標編碼器層的數量,并設置所述預設翻譯模型的目標結構中目標解碼器層的數量為預設值,將所述編碼器層與所述解碼器層的結構關系作為所述目標編碼器層與所述目標解碼器層的目標結構關系,所述標準Transformer模型的結構數據包括所述編碼器層的數量、所述解碼器層的數量和所述編碼器層與所述解碼器層的結構關系;
根據所述維度數據確定所述預設翻譯模型在進行翻譯過程時,待翻譯原文的第一語言詞向量維度與對應的所述待翻譯原文的譯文的第二語言詞向量維度;
基于所述目標結構和所述目標維度數據構建所述預設翻譯模型。
5.如權利要求4所述的文字翻譯方法,其特征在于,所述基于所述目標結構和所述目標維度數據構建所述預設翻譯模型的步驟,包括:
按待翻譯原文的第一語言詞向量維度初始化所述標準Transformer模型,并基于所述目標訓練集將初始化后的標準Transformer模型訓練至收斂,獲取初始化且收斂的標準Transformer模型在進行翻譯過程時的第一語言詞向量維度參數;
按對應所述待翻譯原文的譯文的第二語言詞向量維度調整所述標準Transformer模型,并基于所述目標訓練集將調整后的標準Transformer模型訓練至收斂,獲取被調整且收斂的標準Transformer模型在進行翻譯過程時的第二語言詞向量維度參數;
將結構為目標結構的所述預設翻譯模型中譯文的語言詞向量維度參數調整為所述第二語言詞向量維度參數,原文的語言詞向量維度參數設置為所述第一語言詞向量維度參數,完成對所述預設翻譯模型的參數設置;
基于所述第一語言詞向量維度參數與所述第二語言詞向量維度參數為參數設置后的預設翻譯模型設置維度轉換層,以完成所述預設翻譯模型的構建,所述維度轉換層為全連接層。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于珠海億智電子科技有限公司,未經珠海億智電子科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310476522.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種多測點淋水面壓力檢測儀
- 下一篇:一種轉動式光伏儲能板支撐立柱





