[發明專利]一種在線輔助翻譯的譯文實時預覽方法有效
| 申請號: | 202010260294.7 | 申請日: | 2020-04-03 |
| 公開(公告)號: | CN111401000B | 公開(公告)日: | 2023-06-20 |
| 發明(設計)人: | 陳件;張井;成延;劉旻 | 申請(專利權)人: | 上海一者信息科技有限公司 |
| 主分類號: | G06F40/106 | 分類號: | G06F40/106;G06F40/154;G06F40/47 |
| 代理公司: | 上海驍象知識產權代理有限公司 31315 | 代理人: | 柏祝扣 |
| 地址: | 200090 上海市*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 在線 輔助 翻譯 譯文 實時 預覽 方法 | ||
本發明公開了一種在線輔助翻譯的譯文實時預覽方法,涉及計算機輔助翻譯領域,包括如下步驟:將原文文件通過文件格式轉換器轉換成HTML,將原文解析并分句成按句劃分的句段Segment數組,利用循環遞歸算法,將句段Segment的中元素id埋到轉換后的HTML子標簽中,形成一一對應的關系,前端通過HTML的dom節點來實現句段Segment和HTML之間的聯動,達到實時預覽譯文的效果;本發明提供了一種算法,可以將輔助翻譯中的譯文實時的渲染到瀏覽器中,供譯員查看和參考,極大的節省了翻譯的時間,有著非常明顯的效率提升。
技術領域
本發明涉及計算機輔助翻譯領域,特別涉及一種在線輔助翻譯的譯文實時預覽方法。
背景技術
當代計算機輔助翻譯,需要將文字提取出來,給譯者翻譯成指定目標語言以后,再將譯文填充回去。通常情況下,譯者在翻譯過程中無法在編輯器里查看翻譯文件的原文和譯文。傳統的做法是通過文件轉換的方法,將原文轉換成html格式并通過瀏覽器渲染給翻譯人員查看。但是,翻譯人員在編輯過程中形成的譯文是無法實時查看的。
發明內容
本發明實例提供了一種在線輔助翻譯的譯文實時預覽方法。為了對披露的實施例的一些方面有一個基本的理解,下面給出了簡單的概括。該概括部分不是泛泛評述,也不是要確定關鍵/重要組成元素或描繪這些實施例的保護范圍。其唯一目的是用簡單的形式呈現一些概念,以此作為后面的詳細說明的序言。
根據本發明實施例的第一方面,提供了
一種在線輔助翻譯的譯文實時預覽方法,包括如下步驟:
將原文文件轉換成HTML格式;
將原文解析并分句成按句劃分的句段Segment數組;
利用循環遞歸算法,將所述句段Segment的中元素id埋到所述HTML格式文件中的子標簽中,形成一一對應的關系;
通過HTML的dom節點來實現句段Segment和HTML之間的聯動,達到實時預覽譯文的效果。
優選地,所述原文文件格式是doc、docx、rtf、xls、xlsx、ppt、pptx、pdf、sxw、stw、sxc、stc。
優選地,所述將原文文件轉換成HTML格式,具體方法為利用word自身的轉換功能或者其他第三方工具進行轉換。
優選地,所述將原文解析并分句成按句劃分的句段Segment數組,具體為將所述分句成按句劃分的句段Segment為單詞、短語或句子。
優選地,所述句段Segment數組為句段列表,記錄句段Segment的文本內容和對應的文本標號。
優選地,所述循環遞歸算法包括如下步驟:
定義Atom類型的類,這個類有兩個類型定義為標簽Tag和文本;
將句段列表中的句段Segment內容定義為Atom的文本,句段Segment的標號定義為Atom的標簽Tag;
算法會循環讀取每個Atom,根據Atom的類型來判斷是否放入文本池;
將文本池中的每個Atom與Atom的標簽Tag對應,最終形成一個新的帶id映射的HTML子標簽的集合。
優選地,所述類Atom為自定義類。
優選地,所述每個句段Segment是由一個或者多個Atom組成。
優選地,所述HTML的子標簽是由一個Atom的標簽Tag構成。
優選地,所述句段Segment和HTML之間的聯動的方法為:將Atom的標簽Tag嵌入到HTML子標簽中。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海一者信息科技有限公司,未經上海一者信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010260294.7/2.html,轉載請聲明來源鉆瓜專利網。





