[發明專利]文本翻譯方法及裝置有效
| 申請號: | 201711480227.0 | 申請日: | 2017-12-29 |
| 公開(公告)號: | CN108170686B | 公開(公告)日: | 2020-02-14 |
| 發明(設計)人: | 王亞楠;孟廷;劉俊華;魏思;胡國平 | 申請(專利權)人: | 科大訊飛股份有限公司 |
| 主分類號: | G06F40/58 | 分類號: | G06F40/58 |
| 代理公司: | 11002 北京路浩知識產權代理有限公司 | 代理人: | 苗青盛;馬英迪 |
| 地址: | 230088 安徽省*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 音素序列 詞序列 源文本 向量 編碼向量 目標文本 文本翻譯 語言處理技術 語音識別結果 機器翻譯 翻譯 翻譯結果 解碼階段 容錯處理 音素編碼 詞向量 獲取源 源語音 文本 輸出 | ||
1.一種文本翻譯方法,其特征在于,包括:
獲取源文本對應的音素序列編碼向量及詞序列向量;其中,所述源文本對應的音素序列編碼向量由所述源文本中每一分詞對應的音素編碼向量所構成,所述源文本對應的詞序列向量由所述源文本中每一分詞對應的詞向量所構成,所述源文本對應的音素序列編碼向量中包含的音素編碼向量數與所述源文本對應的詞序列向量中包含的詞向量數相同,所述源文本對應的音素序列編碼向量中包含的音素編碼向量數等于所述源文本中分詞的總數量;
將所述源文本對應的音素序列編碼向量與詞序列向量輸入至翻譯模型,輸出得到所述源文本對應的目標文本。
2.根據權利要求1所述的方法,其特征在于,所述獲取源文本中每一分詞對應的音素編碼向量,包括:
獲取所述源文本中每一分詞對應的音素序列中最后一個音素的編碼向量,并作為每一分詞對應的音素編碼向量。
3.根據權利要求1所述的方法,其特征在于,所述獲取源文本中每一分詞對應的音素編碼向量,包括:
對所述源文本對應的音素序列作卷積處理,得到卷積向量;
根據所述卷積向量的維度及所述源文本對應的詞序列向量中包含的詞向量數,確定池化處理的窗口尺寸;
基于所述窗口尺寸對所述卷積向量作池化處理,得到每一分詞對應的音素序列編碼向量。
4.根據權利要求3所述的方法,其特征在于,所述根據所述卷積向量的維度及所述源文本對應的詞序列向量中包含的詞向量數,確定池化處理的窗口尺寸,包括:
計算所述卷積向量的維度與所述源文本對應的詞序列向量中包含的詞向量數之間的比值,對計算得到的比值向上取整,將得到的整數值作為池化處理的窗口尺寸。
5.根據權利要求1所述的方法,其特征在于,所述每一分詞對應的詞向量為初始詞向量或者詞編碼向量。
6.根據權利要求1所述的方法,其特征在于,所述將所述源文本對應的音素序列編碼向量與詞序列向量輸入至翻譯模型,輸出得到所述源文本對應的目標文本,包括:
將所述源文本中每一分詞對應的音素編碼向量與每一分詞對應的詞向量進行拼接,得到每一分詞對應的特征向量,將每一分詞對應的特征向量輸入至翻譯模型,輸出得到所述源文本對應的目標文本。
7.一種文本翻譯裝置,其特征在于,包括:
獲取模塊,用于獲取源文本對應的音素序列編碼向量及詞序列向量;其中,所述源文本對應的音素序列編碼向量由所述源文本中每一分詞對應的音素編碼向量所構成,所述源文本對應的詞序列向量由所述源文本中每一分詞對應的詞向量所構成,所述源文本對應的音素序列編碼向量中包含的音素編碼向量數與所述源文本對應的詞序列向量中包含的詞向量數相同,所述源文本對應的音素序列編碼向量中包含的音素編碼向量數等于所述源文本中分詞的總數量;
翻譯模塊,用于將所述源文本對應的音素序列編碼向量與詞序列向量輸入至翻譯模型,輸出得到所述源文本對應的目標文本。
8.根據權利要求7所述的裝置,其特征在于,所述獲取模塊,用于對所述源文本對應的音素序列作卷積處理,得到卷積向量;根據所述卷積向量的維度及所述源文本對應的詞序列向量中包含的詞向量數,確定池化處理的窗口尺寸;基于所述窗口尺寸對所述卷積向量作池化處理,得到每一分詞對應的音素序列編碼向量。
9.一種文本翻譯設備,其特征在于,包括:
至少一個處理器;以及
與所述處理器通信連接的至少一個存儲器,其中:
所述存儲器存儲有可被所述處理器執行的程序指令,所述處理器調用所述程序指令能夠執行如權利要求1至6任一所述的方法。
10.一種非暫態計算機可讀存儲介質,其特征在于,所述非暫態計算機可讀存儲介質存儲計算機指令,所述計算機指令使所述計算機執行如權利要求1至6任一所述的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于科大訊飛股份有限公司,未經科大訊飛股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711480227.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:文本情感分析方法、裝置和計算機可讀存儲介質
- 下一篇:一種自動英語翻譯裝置





