[發明專利]基于術語替換的機器翻譯方法及裝置在審
| 申請號: | 202011518588.1 | 申請日: | 2020-12-21 |
| 公開(公告)號: | CN112541365A | 公開(公告)日: | 2021-03-23 |
| 發明(設計)人: | 蔡潔 | 申請(專利權)人: | 語聯網(武漢)信息技術有限公司 |
| 主分類號: | G06F40/58 | 分類號: | G06F40/58 |
| 代理公司: | 北京路浩知識產權代理有限公司 11002 | 代理人: | 王治東 |
| 地址: | 430206 湖北省武漢市東湖新技術開*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 術語 替換 機器翻譯 方法 裝置 | ||
本發明提供一種基于術語替換的機器翻譯方法及裝置,該方法包括:對待翻譯原文進行分詞,判斷每個詞是否為預設術語,將所述待翻譯原文中的每個預設術語替換為占位符;將替換后的待翻譯原文中的詞、占位符和替換的詞的特征轉換為詞向量,將所述占位符的詞向量和所述占位符對應的特征的詞向量進行融合;將融合結果和所述詞的詞向量輸入所述機器翻譯模型,輸出所述待翻譯原文的含占位符的譯文,將所述含占位符的譯文中的占位符替換為相應預設術語的譯文,獲取所述待翻譯原文的最終譯文。本發明實現通過對占位符添加對應的特征,可以有效提高對待翻譯原文進行翻譯的準確性。
技術領域
本發明涉及機器翻譯技術領域,尤其涉及一種基于術語替換的機器翻譯方法及裝置。
背景技術
目前主流的機器翻譯方法是基于“段對段”架構的機器翻譯模型,但人類譯員在實際翻譯過程中,往往會帶有全局或者局部的“知識”。例如,“旁邊的女孩.....”這段文字中省略了主語代詞“她”或“他”,而人類譯員在對這段話進行翻譯時,會參考之前的翻譯知識正確的補充這個代詞。但是“段對段”機器翻譯模型,不會引入全局或局部的翻譯知識,因此,采用機器翻譯模型對這個代詞進行補充時,很容易出錯。對于“段對段”架構的機器翻譯而言,每一個輸入所含代的知識都有助于提高翻譯的準確率。
而現有的術語替換的方式使用一個占位符代替原文中的詞組輸入到機器翻譯中,所有的術語都由類似term這樣的標簽替代。例如,“湯姆”可以是term標簽,“艾達”也可以是term標簽?!皽贰贝蟾怕适且粋€男性的名字,而“艾達”則是女性。若原文為“term1開心的簡直要飛起,拽著term2的胳膊”,則譯文是“term1was so happy that代詞1almost flew up.代詞2grabbedterm2...”顯然,若term1是“湯姆”,則代詞1的為“He”;若term1是“艾達”,則代詞1的為“She”,由于term1代表的含義不同,代詞1有不同的翻譯結果。
雖然術語替換可以解決術語翻譯不準確的問題,但是在翻譯過程中由于使用占用符替代原文中的詞組,則詞組所含有的“知識”丟失,導致原文翻譯結果不準確。
發明內容
本發明提供一種基于術語替換的機器翻譯方法及裝置,用以解決現有技術中翻譯結果不準確的缺陷,實現提高翻譯的準確性。
本發明提供一種基于術語替換的機器翻譯方法,包括:
對待翻譯原文進行分詞,判斷每個詞是否為預設術語,將所述待翻譯原文中的每個預設術語替換為占位符;
將替換后的待翻譯原文中的詞、占位符和替換的詞的特征轉換為詞向量,將所述占位符的詞向量和所述占位符對應的特征的詞向量進行融合;
將融合結果和所述詞的詞向量輸入所述機器翻譯模型,輸出所述待翻譯原文的含占位符的譯文,將所述含占位符的譯文中的占位符替換為相應預設術語的譯文,獲取所述待翻譯原文的最終譯文;
其中,所述機器翻譯模型為,以樣本原文為樣本,以與所述樣本原文對應的樣本譯文為樣本標簽訓練得到。
根據本發明提供的一種基于術語替換的機器翻譯方法,所述將替換后的待翻譯原文中的詞、占位符和替換的詞的特征轉換為詞向量,包括:
基于詞嵌入算法將所述替換后的待翻譯原文中的詞、占位符和替換的詞的特征轉換為詞向量。
根據本發明提供的一種基于術語替換的機器翻譯方法,所述將所述占位符的詞向量和所述占位符對應的特征的詞向量進行融合,包括:
將所述占位符的詞向量和所述占位符對應的特征的詞向量相加。
根據本發明提供的一種基于術語替換的機器翻譯方法,所述將融合結果和所述詞的詞向量輸入所述機器翻譯模型,輸出所述待翻譯原文的含占位符的譯文,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于語聯網(武漢)信息技術有限公司,未經語聯網(武漢)信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011518588.1/2.html,轉載請聲明來源鉆瓜專利網。





