[發明專利]基于模板的多語言翻譯方法及翻譯系統有效
| 申請號: | 201611168076.0 | 申請日: | 2016-12-16 |
| 公開(公告)號: | CN106708809B | 公開(公告)日: | 2021-01-29 |
| 發明(設計)人: | 章云元;祁勱;耿方杰 | 申請(專利權)人: | 攜程旅游網絡技術(上海)有限公司 |
| 主分類號: | G06F40/58 | 分類號: | G06F40/58;G06F40/284 |
| 代理公司: | 上海弼興律師事務所 31283 | 代理人: | 薛琦;謝琦 |
| 地址: | 200335*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 模板 語言 翻譯 方法 系統 | ||
本發明公開了一種基于模板的多語言翻譯方法及翻譯系統;翻譯系統包含特征詞生成模塊、模板生成模塊及翻譯模塊。首先,解析待翻譯文件是否包含至少一個特征變量;其次,將待翻譯文件以及至少一個特征變量進行模板化處理及翻譯;最后,將待翻譯文件進行完整翻譯。本發明能夠應用于在原文與譯文有較為統一翻譯習慣的場景中,得出高質量翻譯結果,并能夠節約人力資源耗費。
技術領域
本發明涉及語言翻譯領域,具體涉及一種基于模板的多語言翻譯方法及翻譯系統。
背景技術
近年來,自然語言處理技術取得了飛速的發展,為機器翻譯提供了良好的技術支持,提高了機器翻譯的質量和效率。但是面對翻譯質量要求極高的場景下,使用通用機器翻譯工具較難達到翻譯質量要求。而采用人工翻譯,則會產生巨大的工作量并重復勞作,翻譯成本較高。本發明通過機器學習人工翻譯結果,記憶并運用翻譯模板,在限定領域的機器翻譯方面取得了良好效果。
發明內容
本發明的目的在于為了解決現有技術中機器翻譯質量較低、采用人工翻譯成本較高等問題的出現;提供一種基于模板的多語言翻譯方法及翻譯系統。
為了達到上述目的,本發明通過以下技術方案實現:
一種基于模板的多語言翻譯方法,所述多語言翻譯方法包含:
解析待翻譯文件是否包含至少一個特征變量;每個所述特征變量為所述待翻譯文件對應語言庫中的一個特征詞,每個所述特征詞為名詞、量詞、習慣用語以及短語中的任意一種詞語;
當包含時,將所述待翻譯文件以及至少一個所述特征變量進行模板化處理及翻譯;
將所述待翻譯文件進行完整翻譯。
較佳地,在解析待翻譯文件是否包含至少一個特征變量的步驟之前,還包含:
根據譯文的語言習慣,將所述待翻譯文件進行符號統一、格式規范化的處理,生成可識別的所述待翻譯文件。
優選地,在解析所述待翻譯文件是否包含至少一個特征變量的步驟中,具體包含:
將所述待翻譯文件進行單句拆分;
解析每個所述單句是否包含與對應所述語言庫相匹配的至少一個所述特征變量;其中,每種所述語言庫包含對應語言的多個所述特征詞。
可選地,在當包含時,將所述待翻譯文件以及至少一個所述特征變量進行模板化處理及翻譯的步驟中,具體包含:
識別所述待翻譯文件的所有所述特征變量,識別所述待翻譯文件其他部分;將每個所述特征變量根據對應譯文進行模板化翻譯,將所述待翻譯文件其他部分進行模板化翻譯。
較優地,將所述待翻譯文件進行完整翻譯的步驟,具體包含:
將每個所述單句進行人工翻譯調整,完成所述待翻譯文件的完整翻譯。
較佳地,所述多語言翻譯方法還包含:
解析采用所述人工翻譯的所述待翻譯文件中是否包含至少一個所述特征詞,當包含時,將至少一個所述特征詞及對應譯文進行保存。
一種基于模板的多語言翻譯系統,所述多語言翻譯系統包含:
特征詞生成模塊,解析待翻譯文件是否包含至少一個特征變量;每個所述特征變量為所述待翻譯文件對應語言庫中的一個特征詞,每個所述特征詞為名詞、量詞、習慣用語以及短語中的任意一種詞語;
模板生成模塊,當包含時,將所述待翻譯文件以及至少一個所述特征變量進行模板化處理及翻譯;
翻譯模塊,將所述待翻譯文件進行完整翻譯。
可選地,所述特征詞生成模塊包含多種語言庫,每種所述語言庫包含對應語言的多個所述特征詞;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于攜程旅游網絡技術(上海)有限公司,未經攜程旅游網絡技術(上海)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611168076.0/2.html,轉載請聲明來源鉆瓜專利網。





