[發明專利]富文本文檔的翻譯方法及裝置在審
| 申請號: | 202110797431.5 | 申請日: | 2021-07-14 |
| 公開(公告)號: | CN113536811A | 公開(公告)日: | 2021-10-22 |
| 發明(設計)人: | 李華順 | 申請(專利權)人: | 杭州隆埠科技有限公司 |
| 主分類號: | G06F40/40 | 分類號: | G06F40/40;G06F40/56;G06F40/126 |
| 代理公司: | 北京國昊天誠知識產權代理有限公司 11315 | 代理人: | 王思超 |
| 地址: | 310030 浙江省杭*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文本 文檔 翻譯 方法 裝置 | ||
本申請公開了一種富文本文檔的翻譯方法及裝置,所述翻譯方法包括:獲取待翻譯的富文本文檔;提取所述富文本文檔中的第一語言的各個第一純文本字符串;獲取各個所述第一純文本字符串對應的第二語言的第二純文本字符串;使用所述第二純文本字符串替換所述富文本文檔中的對應所述第一純文本字符串。
技術領域
本申請涉及網頁翻譯技術領域,尤其涉及一種富文本文檔的翻譯方法及裝置。
背景技術
在常見的超文本標記語言(Hyper Text Mark-up Language,HTML)格式的富文本文檔中,其內容一般包括文字、圖片、視頻、超級鏈接、表格、有序/無序列表以及復雜的樣式等多種信息。而翻譯HTML格式的富文本文檔只需要對文檔中的文字進行處理即可。
在相關技術中,大多數服務只能解決純文本格式的翻譯,少量提供富文本格式支持的服務需要額外的費用,并且在翻譯完成后可能會導致文檔的排版發生變化。
發明內容
本申請公開一種富文本文檔的翻譯方法及裝置,解決了在對富文本文檔翻譯完成后可能會導致文檔的排版發生變化的問題。
為了解決上述問題,本申請采用下述技術方案:
第一方面,本申請實施例公開一種富文本文檔的翻譯方法,包括:獲取待翻譯的富文本文檔;提取所述富文本文檔中的第一語言的各個第一純文本字符串;獲取各個所述第一純文本字符串對應的第二語言的第二純文本字符串;使用所述第二純文本字符串替換所述富文本文檔中的對應所述第一純文本字符串。
第二方面,本申請實施例公開一種富文本文檔的翻譯裝置,包括:第一獲取模塊,用于獲取待翻譯的富文本文檔;提取模塊,用于提取所述富文本文檔中的第一語言的各個第一純文本字符串;第二獲取模塊,用于獲取各個所述第一純文本字符串對應的第二語言的第二純文本字符串;替換模塊,用于使用所述第二純文本字符串替換所述富文本文檔中的對應所述第一純文本字符串。
本申請采用的技術方案能夠達到以下有益效果:
本申請實施例提供一種富文本文檔的翻譯方法,包括:獲取待翻譯的富文本文檔;提取所述富文本文檔中的第一語言的各個第一純文本字符串;獲取各個所述第一純文本字符串對應的第二語言的第二純文本字符串;使用所述第二純文本字符串替換所述富文本文檔中的對應所述第一純文本字符串。本申請通過使用與從待翻譯的富文本文檔中提取的第一語言的各個第一純文本字符串對應的第二語言的第二純文本字符串替換富文本文檔中的對應的第一純文本字符串,有效解決了在對富文本文檔翻譯完成后可能會導致文檔的排版發生變化的問題。
附圖說明
圖1為本申請實施例公開的一種富文本文檔的翻譯方法的流程示意圖;
圖2為本申請實施例公開的文檔對象中文本節點的示意圖;
圖3為本申請實施例公開的提取出的第一純文本字符串數組的示意圖;
圖4為本申請實施例公開的將各個第一純文本字符串分別替換為占位符的示意圖;
圖5為本申請實施例公開的將各個第一純文本字符串中的文本組合為第一字符串文本的示意圖;
圖6為本申請實施例公開的與第一字符串文本對應的第二字符串文本的示意圖;
圖7為本申請實施例公開的使用第二純文本字符串替換富文本文檔中的對應第一純文本字符串的示意圖;
圖8為本申請實施例公開的翻譯效果的示意圖;
圖9為本申請實施例公開的一種富文本文檔的翻譯裝置的結構示意圖。
具體實施方式
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州隆埠科技有限公司,未經杭州隆埠科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110797431.5/2.html,轉載請聲明來源鉆瓜專利網。





