[發明專利]語句翻譯方法、裝置、電子設備和存儲介質在審
| 申請號: | 202010622075.9 | 申請日: | 2020-06-30 |
| 公開(公告)號: | CN111832322A | 公開(公告)日: | 2020-10-27 |
| 發明(設計)人: | 李響 | 申請(專利權)人: | 北京小米松果電子有限公司 |
| 主分類號: | G06F40/58 | 分類號: | G06F40/58;G06F40/284 |
| 代理公司: | 北京英創嘉友知識產權代理事務所(普通合伙) 11447 | 代理人: | 魏云鹿 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語句 翻譯 方法 裝置 電子設備 存儲 介質 | ||
1.一種語句翻譯方法,其特征在于,所述方法包括:
獲取待翻譯語句中的多個詞語;
對所述待翻譯語句進行拆分處理,得到所述待翻譯語句中的多個字符;
根據所述待翻譯語句中的多個詞語,確定所述待翻譯語句中的每個字符對應的關聯信息,所述關聯信息用于指示該字符與該字符所在的詞語之間的關聯關系;
將所述待翻譯語句中的每個字符、以及每個所述字符對應的關聯信息輸入預先訓練的翻譯模型,得到翻譯后的目標語句。
2.根據權利要求1所述的方法,其特征在于,所述關聯信息包括字符標簽,所述字符標簽用于指示該字符在該字符所在的詞語中的位置,所述將所述待翻譯語句中的每個字符、以及每個所述字符對應的關聯信息輸入預先訓練的翻譯模型,得到翻譯后的目標語句包括:
針對所述待翻譯語句中的每個字符,獲取該字符的字符向量,以及該字符對應的字符標簽的標簽向量,將該字符的字符向量與該字符的標簽向量進行按位與操作,得到該字符對應的字符特征向量;
將得到的每個所述字符對應的字符特征向量作為所述翻譯模型的輸入,得到翻譯后的目標語句。
3.根據權利要求2所述的方法,其特征在于,所述翻譯模型包括編碼器和解碼器,所述將得到的每個所述字符對應的字符特征向量作為所述翻譯模型的輸入,得到翻譯后的目標語句包括:
將每個所述字符對應的字符特征向量輸入所述編碼器,得到所述編碼器輸出的目標編碼向量;
將所述目標編碼向量輸入所述解碼器,得到所述解碼器輸出的所述目標語句。
4.根據權利要求3所述的方法,其特征在于,所述編碼器為N個,所述解碼器為M個,N和M均為大于或等于2的正整數,所述將所述字符對應的字符特征向量輸入所述編碼器,得到所述編碼器輸出的目標編碼向量包括:
將第n-1個所述編碼器的輸出作為第n個所述編碼器的輸入,以得到第n個所述編碼器輸出的編碼向量,1n≤N,且n為正整數,第1個所述編碼器的輸入為所述字符對應的字符特征向量;
將第N個所述編碼器的輸出的所述編碼向量,作為所述目標編碼向量;
所述將所述目標編碼向量輸入所述解碼器,得到所述解碼器輸出的所述目標語句包括:
將第m-1個所述解碼器的輸出作為第m個所述解碼器的輸入,以得到第m個所述解碼器輸出的解碼語句,1m≤M,且m為正整數,第1個所述解碼器的輸入為所述目標編碼向量;
將第M個所述解碼器的輸出的所述解碼語句,作為所述目標語句。
5.根據權利要求1-4中任一項所述的方法,其特征在于,所述翻譯模型是通過以下方式訓練的:
獲取樣本訓練集,所述樣本訓練集包括訓練語句,以及所述訓練語句對應的翻譯語句;所述訓練語句包括多個第一字符,以及每個所述第一字符對應的字符標簽,所述翻譯語句包括多個第二字符,以及每個所述第二字符對應的字符標簽;
根據所述樣本訓練集對預設訓練模型進行訓練,得到所述翻譯模型。
6.根據權利要求5所述的方法,其特征在于,所述預設訓練模型包括訓練編碼器和訓練解碼器,所述根據所述樣本訓練集,對預設訓練模型進行訓練,得到所述翻譯模型包括:
針對所述訓練語句中的每個第一字符,獲取該第一字符的字符向量,以及該第一字符對應的字符標簽的標簽向量,將該第一字符的字符向量與該第一字符的標簽向量進行按位與操作,得到該第一字符的對應的字符特征向量;
針對所述訓練語句中的每個第二字符,獲取該第二字符的字符向量,以及該第二字符對應的字符標簽的標簽向量,將該第二字符的字符向量與該第二字符的標簽向量進行按位與操作,得到該第二字符對應的字符特征向量;
將得到的每個所述第一字符對應的字符特征向量作為所述訓練編碼器的輸入,得到訓練編碼向量;
將得到的每個所述第二字符對應的字符特征向量,以及所述訓練編碼向量作為所述訓練解碼器的輸入,利用預設的損失函數,對所述預設訓練模型進行訓練,并在所述損失函數達到最小值時,得到所述翻譯模型。
7.根據權利要求6所述的方法,其特征在于,所述損失函數為負對數似然函數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京小米松果電子有限公司,未經北京小米松果電子有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010622075.9/1.html,轉載請聲明來源鉆瓜專利網。





