[發明專利]一種機器翻譯方法和裝置有效
| 申請號: | 201911115167.1 | 申請日: | 2019-11-14 |
| 公開(公告)號: | CN110826345B | 公開(公告)日: | 2023-09-05 |
| 發明(設計)人: | 韓慶宏 | 申請(專利權)人: | 北京香儂慧語科技有限責任公司 |
| 主分類號: | G06F40/58 | 分類號: | G06F40/58 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 柳欣 |
| 地址: | 100080 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 機器翻譯 方法 裝置 | ||
1.一種機器翻譯方法,其特征在于,包括:
獲取源語言文本,將所述源語言文本輸入到服務器中運行的注意力變換模型中,對所述源語言文本進行處理,得到所述源語言文本的上下文相關編碼表示,字符,可以是但不限于:字、詞組、以及短語;
對所述源語言文本中各所述字符的上下文相關編碼表示進行對齊翻譯,得到所述源語言文本的初步翻譯結果;其中,所述初步翻譯結果與所述源語言文本的語義一致;
對所述初步翻譯結果中的字符進行修正,得到所述源語言文本對應的目標語言翻譯結果,包括:
獲取所述初步翻譯結果的已執行修正記錄;所述已執行修正記錄,包括:每次對所述初步翻譯結果中各字符進行修正時使用的操作標簽;所述操作標簽,包括:交換標簽、刪除標簽、插入標簽、替換標簽或者保留標簽;
對所述初步翻譯結果的字符進行特征提取,得到所述初步翻譯結果的字符的語義特征,并根據得到的語義特征確定所述初步翻譯結果的字符的語義表示;
根據所述源語言文本中各字符的上下文相關編碼表示、所述初步翻譯結果的字符的語義表示、以及所述已執行修正記錄,確定當前對所述初步翻譯結果中各字符的操作標簽;
根據當前確定的各字符的操作標簽對應的修正方式對所述初步翻譯結果中各字符進行修正,得到修正后的初步翻譯結果;
對修正操作次數進行增量操作,當所述修正操作次數達到修正操作閾值時,將所述修正后的初步翻譯結果作為所述源語言文本對應的目標語言翻譯結果。
2.根據權利要求1所述的方法,其特征在于,所述對所述初步翻譯結果中的字符進行修正,得到所述源語言文本對應的目標語言翻譯結果,還包括:
當所述修正操作次數未達到修正操作次數時,通過語言模型對修正后的初步翻譯結果進行處理,得到修正后的初步翻譯結果的分數;
當所述分數大于等于分數閾值時,將所述修正后的初步翻譯結果作為所述源語言文本對應的目標語言翻譯結果;
當所述分數小于分數閾值時,將當前對所述初步翻譯結果中各字符的操作標簽存儲到所述已執行修正記錄中,利用所述修正后的初步翻譯結果對所述初步翻譯結果進行更新,并返回所述獲取所述初步翻譯結果的已執行修正記錄步驟。
3.根據權利要求1所述的方法,其特征在于,在所述根據當前確定的各字符的操作標簽對應的修正方式對所述初步翻譯結果中各字符進行修正,得到修正后的初步翻譯結果步驟之前,所述對所述初步翻譯結果中的字符進行修正,得到所述源語言文本對應的目標語言翻譯結果,還包括:
當確定當前所述初步翻譯結果中各字符的操作標簽中都是保留標簽時,將所述初步翻譯結果作為所述源語言文本對應的目標語言翻譯結果;
當確定當前對所述初步翻譯結果中各字符的操作標簽中存在除所述保留標簽的其他操作標簽時,繼續執行所述根據當前確定的各字符的操作標簽對應的修正方式對所述初步翻譯結果中各字符進行修正,得到修正后的初步翻譯結果步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京香儂慧語科技有限責任公司,未經北京香儂慧語科技有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911115167.1/1.html,轉載請聲明來源鉆瓜專利網。





