[發明專利]一種翻譯方法及裝置、計算設備、存儲介質和芯片有效
| 申請號: | 201811638114.3 | 申請日: | 2018-12-29 |
| 公開(公告)號: | CN109710953B | 公開(公告)日: | 2023-04-11 |
| 發明(設計)人: | 李長亮;唐劍波;郭馨澤;王怡然 | 申請(專利權)人: | 成都金山互動娛樂科技有限公司;北京金山數字娛樂科技有限公司 |
| 主分類號: | G06F40/47 | 分類號: | G06F40/47;G06F40/58 |
| 代理公司: | 北京智信禾專利代理有限公司 11637 | 代理人: | 吳肖肖 |
| 地址: | 610041 四川省成都市中國(四川)*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 翻譯 方法 裝置 計算 設備 存儲 介質 芯片 | ||
本申請提供一種翻譯方法及裝置、計算設備、存儲介質和芯片,其中,所述方法包括:計算待翻譯語句與第一語句的相似度,獲得相似度高于閾值的第一語句以及與第一語句互為譯文關系的第二語句;根據第一語句進行處理,得到第一編碼向量,將第一編碼向量輸入至翻譯模型的編碼層;將待翻譯語句輸入翻譯模型的編碼層,以使編碼層根據第一編碼向量和待翻譯語句生成第二編碼向量,并將第二編碼向量輸入翻譯模型的解碼層;根據第二語句進行處理得到第一解碼向量,將第一解碼向量輸入至解碼層,以使解碼層根據第一解碼向量以及第二編碼向量生成第二解碼向量,并根據第二解碼向量得到翻譯語句。
技術領域
本申請涉及計算機技術領域,特別涉及一種翻譯方法及裝置、計算設備、?存儲介質和芯片。
背景技術
隨著計算機運算能力的提升,神經網絡的應用越來越廣泛,例如構建翻譯?模型,以實現源語言到目標語言的轉換。一般地,翻譯模型的架構包括:編碼?層(encoder)—解碼層(decoder)。編碼層實現對待翻譯的源語句進行編碼生成?向量,解碼層實現對源語句的向量進行解碼生成對應的目標語句。
翻譯模型是利用訓練集進行優化,獲得一個對于全體訓練集數據的訓練好?的模型,然后使用這個訓練好的翻譯模型對新輸入的語句進行編碼和解碼,從?而獲得對這個新輸入語句對應的翻譯語句。
在翻譯模型的訓練階段,通過訓練集中的源語句和目標語句訓練翻譯模型。?翻譯模型的編碼層利用源語句的字典,對輸入的源語句進行編碼,獲得一個語?義向量;然后再利用目標語句的字典對這個語義向量進行解碼,獲得最終輸出?的目標語句序列,然后將輸出的目標語句序列與訓練集中的目標語句進行對比,?以優化翻譯模型。
一般而言,翻譯模型在使用訓練集訓練完后,在使用過程中就不再需要訓?練集參與了。所以翻譯模型是以訓練集為基礎的全局最優解,但是在實際使用?階段可能會忽略輸入語句中的具體語義信息,導致輸入語句的翻譯結果信息缺?失。
發明內容
有鑒于此,本申請實施例提供了一種翻譯方法及裝置、計算設備、存儲介?質和芯片,以解決現有技術中存在的技術缺陷。
本申請實施例提供了一種翻譯方法,所述方法包括:
計算待翻譯語句與第一語句的相似度,獲得相似度高于閾值的第一語句以?及與所述第一語句互為譯文關系的第二語句;
根據第一語句進行處理,得到第一編碼向量,將第一編碼向量輸入至翻譯?模型的編碼層;
將待翻譯語句輸入翻譯模型的編碼層,以使所述編碼層根據所述第一編碼?向量和所述待翻譯語句生成第二編碼向量,并將所述第二編碼向量輸入翻譯模?型的解碼層;
根據第二語句進行處理,得到第一解碼向量,將所述第一解碼向量輸入至?解碼層,以使所述解碼層根據所述第一解碼向量以及所述第二編碼向量生成第?二解碼向量,并根據所述第二解碼向量得到翻譯語句。
本申請實施例公開了一種翻譯裝置,所述裝置包括:
相似度計算模塊,被配置為計算待翻譯語句與第一語句的相似度,獲得相?似度高于閾值的第一語句以及與所述第一語句互為譯文關系的第二語句;
第一編碼向量生成模塊,被配置為根據第一語句進行處理,得到第一編碼?向量,將第一編碼向量輸入至翻譯模型的編碼層;
第二編碼向量生成模塊,被配置為將待翻譯語句輸入翻譯模型的編碼層,?以使所述編碼層根據所述第一編碼向量和所述待翻譯語句生成第二編碼向量,?并將所述第二編碼向量輸入翻譯模型的解碼層;
第一解碼向量生成模塊,被配置為根據第二語句進行處理,得到第一解碼?向量,將所述第一解碼向量輸入至解碼層;
第二解碼向量生成模塊,被配置為使所述解碼層根據所述第一解碼向量以?及所述第二編碼向量生成第二解碼向量,并根據所述第二解碼向量得到翻譯語?句。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于成都金山互動娛樂科技有限公司;北京金山數字娛樂科技有限公司,未經成都金山互動娛樂科技有限公司;北京金山數字娛樂科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811638114.3/2.html,轉載請聲明來源鉆瓜專利網。





