[發明專利]一種篇章級文本翻譯方法及裝置有效
| 申請號: | 201810463138.3 | 申請日: | 2018-05-15 |
| 公開(公告)號: | CN110489761B | 公開(公告)日: | 2021-02-02 |
| 發明(設計)人: | 馬志強;劉俊華;魏思;胡國平 | 申請(專利權)人: | 科大訊飛股份有限公司 |
| 主分類號: | G06F40/58 | 分類號: | G06F40/58;G06F40/151 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 張小娜;王寶筠 |
| 地址: | 230031 安徽*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 篇章 文本 翻譯 方法 裝置 | ||
本申請公開了一種篇章級文本翻譯方法及裝置,該方法包括:將待翻譯的篇章級文本中的每一文本單位,分別作為待翻譯文本,然后,從篇章級文本中獲取待翻譯文本的關聯文本,并根據該關聯文本對待翻譯文本進行翻譯。可見,在對待翻譯文本進行翻譯時,不但考慮了待翻譯文本的當前語境,還考慮了待翻譯文本的關聯文本內容,能夠提高待翻譯文本的翻譯結果的準確性,因而提升了用戶體驗。
技術領域
本申請涉及文本翻譯技術領域,尤其涉及一種篇章級文本翻譯方法及裝置。
背景技術
篇章級文本是由一連串句子組成的,例如,篇章級文本可以是演講稿、雜志文章、文學作品等。由于篇章級文本最重要的特征是句子之間的銜接性和連貫性,因此,篇章級文本不僅僅是一連串句子的集合,更是一個結構完整、功能明確的語義統一體。
對于篇章級文本,應使用篇章級文本翻譯方法對其進行翻譯,在現有的篇章級文本翻譯方法中,一般是將待翻譯的篇章級文本整體作為翻譯對象直接進行翻譯,但翻譯效果并不好,即翻譯結果的準確性不高,從而降低了用戶體驗。
發明內容
本申請實施例的主要目的在于提供一種篇章級文本翻譯方法及裝置,在對篇章級文本進行翻譯時,能夠提高翻譯結果的準確性。
本申請實施例提供的一種篇章級文本翻譯方法,包括:
獲取待翻譯文本,所述待翻譯文本為待翻譯的篇章級文本中的單位文本;
獲取所述待翻譯文本的關聯文本,所述關聯文本包括上文源文本、下文源文本以及上文目標文本中的至少一項;
其中,所述上文源文本為所述篇章級文本中的在所述待翻譯文本之前的至少一條單位文本,所述下文源文本為所述篇章級文本中的在所述待翻譯文本之后的至少一條單位文本,所述上文目標文本為對所述上文源文本進行翻譯后的文本;
根據所述關聯文本對所述待翻譯文本進行翻譯。
可選的,所述根據所述關聯文本對所述待翻譯文本進行翻譯,包括:
利用預先構建的編解碼模型,來根據所述關聯文本對所述待翻譯文本進行翻譯。
可選的,所述根據所述關聯文本對所述待翻譯文本進行翻譯,包括:
對所述待翻譯文本進行編碼得到初始編碼結果,所述初始編碼結果用于表達所述待翻譯文本的語義信息;
對所述關聯文本進行編碼得到關聯編碼結果,所述關聯編碼結果用于表達所述關聯文本的語義信息;
利用所述關聯編碼結果中的全部或部分編碼結果處理所述初始編碼結果,得到目標編碼結果,所述目標編碼結果用于表達所述待翻譯文本的語義信息、且攜帶了所述關聯文本中的全部或部分語義信息;
通過對所述目標編碼結果進行解碼,以實現對所述待翻譯文本的翻譯。
可選的,所述對所述待翻譯文本進行編碼得到初始編碼結果,包括:
對所述待翻譯文本的各個單詞進行編碼,得到初始編碼結果;
相應地,所述對所述關聯文本進行編碼得到關聯編碼結果,包括:
對所述關聯文本中的每一文本單位的各個單詞進行編碼,得到分別對應于每一文本單位的編碼結果,并將這些編碼結果作為關聯編碼結果。
可選的,所述對所述待翻譯文本中的各個單詞進行編碼之后,還包括:
對所述待翻譯文本的各個單詞的編碼結果進行累加,得到對應于所述待翻譯文本的累加結果;
相應地,所述對所述關聯文本中的每一文本單位的各個單詞進行編碼之后,還包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于科大訊飛股份有限公司,未經科大訊飛股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810463138.3/2.html,轉載請聲明來源鉆瓜專利網。





