[發明專利]文本翻譯方法、裝置、電子設備及存儲介質在審
| 申請號: | 202210139791.0 | 申請日: | 2022-02-16 |
| 公開(公告)號: | CN114490668A | 公開(公告)日: | 2022-05-13 |
| 發明(設計)人: | 林麗晶 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06F16/22 | 分類號: | G06F16/22;G06F16/28;G06F40/289;G06F40/58 |
| 代理公司: | 深圳市賽恩倍吉知識產權代理有限公司 44334 | 代理人: | 龔慧惠 |
| 地址: | 518000 廣東省深圳市福田區福*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文本 翻譯 方法 裝置 電子設備 存儲 介質 | ||
1.一種文本翻譯方法,其特征在于,所述方法包括:
響應于對待翻譯文本的翻譯指令,對所述待翻譯文本進行遞歸拆分,得到多個第一文本字符串;
根據所述翻譯指令對每個所述第一文本字符串進行詞根匹配翻譯,得到多個第二文本字符串;
計算每個所述第二文本字符串的ASCII碼值,并根據所述ASCII碼值從所述多個第二文本字符串中選取多個候選文本字符串;
根據所述多個候選文本字符串生成所述待翻譯文本的目標翻譯文本。
2.如權利要求1所述的文本翻譯方法,其特征在于,所述對所述待翻譯文本進行遞歸拆分,得到多個第一文本字符串包括:
獲取所述待翻譯文本的文本字符串長度,并根據所述文本字符串長度確定遞歸拆分總層;
在進行第一層拆分時,對所述待翻譯文本進行逐字拆分,并使用預設拆分符將逐字拆分得到的字符串進行連接,得到一個第一文本字符串;
在進行當前層拆分時,根據所述當前層的層數對所述待翻譯文本進行拆分,得到第一待翻譯子文本和第二待翻譯子文本,對所述第一待翻譯子文本進行逐字拆分并使用所述預設拆分符進行連接得到第一文本子字符串,對所述第二待翻譯子文本進行整體拆分并使用所述預設拆分符進行連接得到第二文本子字符串,使用所述預設拆分符連接所述第一文本子字符串和所述第二文本子字符串得到一個第一文本字符串;對所述第二待翻譯子文本按照所述當前層的上一層的拆分過程進行再拆分,直到按照所述第一層的拆分過程進行再拆分為止,將所述第一文本子字符串與每次再拆分得到的文本子字符串進行合并,得到多個第一文本字符串;
在進行最后一層拆分時,對所述待翻譯文本進行整體拆分,得到一個第一文本字符串。
3.如權利要求2所述的文本翻譯方法,其特征在于,所述根據所述當前層的層數對所述待翻譯文本進行拆分,得到第一待翻譯子文本和第二待翻譯子文本包括:
根據所述當前層的層數確定需遍歷的字符的個數;
根據所述需遍歷的字符的個數從所述待翻譯文本的最后一個字符開始向前遍歷并將遍歷到的字符作為所述第二待翻譯子文本;
將所述待翻譯文本中未被遍歷的字符作為所述第一待翻譯子文本。
4.如權利要求2所述的文本翻譯方法,其特征在于,所述根據所述翻譯指令對每個所述第一文本字符串進行詞根匹配翻譯,得到多個第二文本字符串包括:
根據所述翻譯指令確定翻譯語種;
獲取與所述翻譯語種對應的詞根表;
根據所述詞根表對每個所述第一文本字符串進行詞根匹配,得到多個第二文本字符串。
5.如權利要求4所述的文本翻譯方法,其特征在于,所述根據所述詞根表對每個所述第一文本字符串進行詞根匹配,得到多個第二文本字符串包括:
使用所述預設拆分符對每個所述第一文本字符串進行切分,得到多個目標文本子字符串;
從第一個目標文本子字符串開始遍歷,直到最后一個目標文本子字符串結束,并將每次遍歷到的目標文本子字符串與所述詞根表中的每個詞根進行匹配;
當所述遍歷到的目標文本子字符串與所述詞根表中的某個詞根匹配成功時,則將所述遍歷到的目標文本子字符串替換為所述詞根,得到所述第二文本字符串;
當所述遍歷到的目標文本子字符串與所述詞根表中的所有詞根匹配失敗時,則將所述遍歷到的目標文本子字符串進行保留,得到所述第二文本字符串。
6.如權利要求1至5中任意一項所述的文本翻譯方法,其特征在于,所述根據所述多個候選文本字符串生成所述待翻譯文本的目標翻譯文本包括:
計算所述候選文本字符串中每個候選文本子字符串在所述待翻譯文本中的重要度;
根據所述重要度計算對應的所述候選文本字符串的匹配質量;
根據所述匹配質量從所述多個候選文本字符串中選取一個候選文本字符串作為目標文本字符串;
將所述目標文本字符串確定為所述待翻譯文本的目標翻譯文本。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210139791.0/1.html,轉載請聲明來源鉆瓜專利網。





