[發(fā)明專利]翻譯處理方法、裝置、計算機設備和計算機可讀存儲介質(zhì)有效
| 申請?zhí)枺?/td> | 201811204175.9 | 申請日: | 2018-10-16 |
| 公開(公告)號: | CN109344413B | 公開(公告)日: | 2022-05-20 |
| 發(fā)明(設計)人: | 熊皓;何中軍;胡曉光;李芝;吳華;忻舟;吳甜;王海峰 | 申請(專利權)人: | 北京百度網(wǎng)訊科技有限公司 |
| 主分類號: | G06F40/58 | 分類號: | G06F40/58;G06F40/30 |
| 代理公司: | 北京清亦華知識產(chǎn)權代理事務所(普通合伙) 11201 | 代理人: | 宋合成 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 翻譯 處理 方法 裝置 計算機 設備 可讀 存儲 介質(zhì) | ||
1.一種翻譯處理方法,其特征在于,所述方法包括以下步驟:
獲取源語言的文本段;其中,所述文本段包括多個源語言句子;
對所述文本段進行語義識別,生成所述文本段的語義信息;
根據(jù)預先學習得到的源語言與目標語言之間句子數(shù)量的對應關系,確定所述文本段中各源語言句子對應的目標語言句子的數(shù)量;
根據(jù)所述文本段的語義信息,對所述文本段中各源語言句子進行翻譯處理,得到對應數(shù)量的目標語言句子;
所述根據(jù)所述文本段的語義信息,對所述文本段中各源語言句子進行翻譯處理,得到對應數(shù)量的目標語言句子,包括:
對各源語言句子順序進行翻譯處理得到對應數(shù)量的目標語言句子;
其中,根據(jù)所述文本段的語義信息,以及根據(jù)排序在前的源語言句子進行翻譯處理已得到的目標語言句子,對排序在后的源語言句子進行翻譯處理。
2.根據(jù)權利要求1所述的翻譯處理方法,其特征在于,所述對各源語言句子順序進行翻譯處理得到對應數(shù)量的目標語言句子之前,還包括:
根據(jù)各源語言句子在所述文本段中的出現(xiàn)順序,生成句子序列;
若一個源語言句子對應至少兩個目標語言句子,根據(jù)所述至少兩個目標語言句子的句子個數(shù),對所述一個源語言句子進行復制,將所述復制得到的源語言句子插入所述句子序列中與所述一個源語言句子的相鄰位置;
若至少兩個源語言句子對應一個目標語言句子,對所述至少兩個源語言句子進行合并,將合并得到的源語言句子替換所述句子序列中的所述至少兩個源語言句子;
對不存在對應目標語言句子的源語言句子從所述句子序列中刪除;
根據(jù)所述句子序列中各源語言句子順序,確定各源語言句子的翻譯處理順序。
3.根據(jù)權利要求1所述的翻譯處理方法,其特征在于,所述對各源語言句子順序進行翻譯處理得到對應數(shù)量的目標語言句子,包括:
對當前處理的源語言句子,將對應的語義向量以及所含單詞在對應源語言句子中的相對位置信息輸入翻譯模型的編碼器中,以根據(jù)所述文本段的語義信息和已得到的目標語言句子的字符向量進行編碼,得到編碼向量;
將所述編碼向量輸入所述翻譯模型的解碼器中,得到對應目標語言句子的字符向量。
4.根據(jù)權利要求3所述的翻譯處理方法,其特征在于,所述將對應的語義向量以及所含單詞在對應源語言句子中的相對位置信息輸入翻譯模型的編碼器中,以根據(jù)所述文本段的語義信息和已得到的目標語言句子的字符向量進行編碼,得到編碼向量,包括:
根據(jù)當前處理的源語言句子,生成用于指示當前處理的源語言句子與所含各單詞的語義依賴程度的第一注意力信息;
根據(jù)所述第一注意力信息和所述文本段的語義信息,生成用于指示當前處理的源語言句子與所述文本段的語義依賴程度的第二注意力信息;
根據(jù)所述第二注意力信息和所述已得到的目標語言句子的字符向量,生成用于指示當前處理的源語言句子與所述已得到的目標語言句子的單詞一致性的第三注意力信息;
根據(jù)所述第三注意力信息生成所述編碼向量。
5.根據(jù)權利要求4所述的翻譯處理方法,其特征在于,所述根據(jù)當前處理的源語言句子,生成用于指示當前處理的源語言句子與所含各單詞的語義依賴程度的第一注意力信息,包括:
將當前處理的源語言句子對應的語義向量以及所含單詞在對應源語言句子中的相對位置信息輸入所述編碼器的第一多頭注意力模型層,以得到當前處理的源語言句子與所含各單詞的語義依賴程度,并將各單詞的語義依賴程度作為第一權重;
利用所述編碼器的第一歸一化層,對所述第一權重進行歸一化后,利用歸一化的第一權重對所含單詞對應的編碼進行加權求和,得到所述第一注意力信息。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網(wǎng)訊科技有限公司,未經(jīng)北京百度網(wǎng)訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811204175.9/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





