[發明專利]一種面向細分領域的國防軍工領域機器翻譯方法及系統在審
| 申請號: | 201910948363.0 | 申請日: | 2019-10-08 |
| 公開(公告)號: | CN110705320A | 公開(公告)日: | 2020-01-17 |
| 發明(設計)人: | 雷賀功;李斌;姚晗;晏裕生;程潔丹;孫孟陽;董文軒;江洋 | 申請(專利權)人: | 中國船舶工業綜合技術經濟研究院 |
| 主分類號: | G06F40/58 | 分類號: | G06F40/58;G06F16/35;G06K9/62 |
| 代理公司: | 11569 北京高沃律師事務所 | 代理人: | 劉鳳玲 |
| 地址: | 100081 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 機器翻譯 翻譯 國防軍工 語料 平行 文本 文本分類模型 翻譯結果 文本翻譯 語料庫 調用 通用 | ||
1.一種面向細分領域的國防軍工領域機器翻譯方法,其特征在于,所述方法包括:
獲取語料庫中的平行語料句對;所述平行語料句對包括原文和對應譯文;
獲取訓練好的SVM文本分類模型;
采用所述訓練好的SVM文本分類模型將所述平行語料句對分類到國防軍工領域知識體系的各個細分領域中;
采用各個所述細分領域的平行語料句對分別訓練通用機器翻譯模型,生成對應的細分領域機器翻譯模型;
獲取待翻譯文本;
采用所述SVM文本分類模型確定所述待翻譯文本的細分領域;
調用與所述待翻譯文本的細分領域對應的細分領域機器翻譯模型對所述待翻譯文本進行翻譯,生成細分領域翻譯結果。
2.根據權利要求1所述的國防軍工領域機器翻譯方法,其特征在于,在所述獲取語料庫中的平行語料句對之前,還包括:
獲取已有的國防科技領域翻譯成果;所述翻譯成果為已經翻譯成功的文本的原文和譯文;
采用句對齊工具將篇章級的所述翻譯成果劃分為句子級翻譯成果,并按照原文和譯文對所述句子級翻譯成果進行句對齊操作,生成多條平行語料句對存儲在所述語料庫中。
3.根據權利要求2所述的國防軍工領域機器翻譯方法,其特征在于,在所述獲取訓練好的SVM文本分類模型之前,還包括:
選取所述語料庫中已經標注細分領域的多條所述平行語料句對作為訓練集;
采用支持向量機SVM方法對所述訓練集中的每條平行語料句對和對應的細分領域進行訓練,生成訓練好的SVM文本分類模型。
4.根據權利要求3所述的國防軍工領域機器翻譯方法,其特征在于,在所述生成細分領域翻譯結果之后,還包括:
獲取所述細分領域翻譯結果的人工校對結果;
采用句對齊工具將所述人工校對結果劃分為多條平行語料句對并存儲在所述語料庫中。
5.根據權利要求4所述的國防軍工領域機器翻譯方法,其特征在于,在所述采用所述SVM文本分類模型確定所述待翻譯文本的細分領域之后,還包括:
判斷用戶是否對所述待翻譯文本的細分領域進行手動調整,獲得第一判斷結果;
若所述第一判斷結果為用戶未對所述待翻譯文本的細分領域進行手動調整,則將所述待翻譯文本及其對應的細分領域存儲至所述語料庫中;
若所述第一判斷結果為用戶對所述待翻譯文本的細分領域進行了手動調整,則判斷細分領域標注人員是否認可所述SVM文本分類模型確定的所述待翻譯文本的細分領域,獲得第二判斷結果;
若所述第二判斷結果為所述細分領域標注人員認可所述SVM文本分類模型確定的所述待翻譯文本的細分領域,則將所述待翻譯文本及其對應的細分領域存儲至所述語料庫中;
若所述第二判斷結果為所述細分領域標注人員不認可所述SVM文本分類模型確定的所述待翻譯文本的細分領域,則不對所述待翻譯文本及其對應的細分領域進行存儲。
6.一種面向細分領域的國防軍工領域機器翻譯系統,其特征在于,所述系統包括:
平行語料句對獲取模塊,用于獲取語料庫中的平行語料句對;所述平行語料句對包括原文和對應譯文;
SVM文本分類模型獲取模塊,用于獲取訓練好的SVM文本分類模型;
平行語料句對細分領域劃分模塊,用于采用所述訓練好的SVM文本分類模型將所述平行語料句對分類到國防軍工領域知識體系的各個細分領域中;
細分領域機器翻譯模型訓練模塊,用于采用各個所述細分領域的平行語料句對分別訓練通用機器翻譯模型,生成對應的細分領域機器翻譯模型;
待翻譯文本獲取模塊,用于獲取待翻譯文本;
細分領域自動劃分模塊,用于采用所述SVM文本分類模型確定所述待翻譯文本的細分領域;
細分領域機器翻譯模塊,用于調用與所述待翻譯文本的細分領域對應的細分領域機器翻譯模型對所述待翻譯文本進行翻譯,生成細分領域翻譯結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國船舶工業綜合技術經濟研究院,未經中國船舶工業綜合技術經濟研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910948363.0/1.html,轉載請聲明來源鉆瓜專利網。





