[發明專利]一種關鍵詞生成方法及裝置在審
| 申請號: | 201910344875.6 | 申請日: | 2019-04-26 |
| 公開(公告)號: | CN110083837A | 公開(公告)日: | 2019-08-02 |
| 發明(設計)人: | 閆莉;高建清;劉俊華;胡國平 | 申請(專利權)人: | 科大訊飛股份有限公司 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27;G06F17/28;G10L15/26 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 張小娜;王寶筠 |
| 地址: | 230088 安徽*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 翻譯 文本 目標語音 關聯性 提示 預測 申請 語言 | ||
本申請公開了一種關鍵詞生成方法及裝置,該方法包括:當生成了目標語音的識別文本之后,從該識別文本中提取出各個歷史關鍵詞,以及生成與各個歷史關鍵詞具有強關聯性的聯想關鍵詞。其中,與歷史關鍵詞具有強相關性的聯想關鍵詞能夠提示翻譯人員在未來待翻譯內容中可能出現的關鍵詞,從而節省了翻譯人員投入到預測未來待翻譯內容所需的精力。如此,當翻譯人員在聯想關鍵詞的輔助下進行翻譯時,能夠投入更多的精力在語言的組織和表達上,從而提升了翻譯速度和翻譯質量。
技術領域
本申請涉及翻譯技術領域,尤其涉及一種關鍵詞生成方法及裝置。
背景技術
同聲傳譯是一個難度極高的語言傳遞及轉化的多任務過程,譯員需要在短時間內完成源語言的聽辨、理解、分析、記憶,以及目標語言的組織、表達、監聽及修正,并達到與演講者幾乎完全同步的實時翻譯效果。在Gile提出的同聲傳譯“認知負荷模型”中,將聽力理解、短期記憶及翻譯作為譯員需要完成的三項基本任務。同聲傳譯過程中,由于精力有限,譯員需要協調分配到上述三項任務上的精力,才能保證翻譯順利完成。
目前,譯員在同聲傳譯期間,需要對演講內容進行關鍵詞記錄,包括數字、長句內容概述等以幫助記憶,基于此,譯員能夠對常用的固定搭配語法和演講人表達方式進行預測,以輔助完成后續翻譯。但譯員在同聲傳譯期間進行關鍵詞記錄會消耗大量精力,導致譯員沒有足夠的精力進行翻譯預測,更無法投入更多的精力在語言的組織和表達上,從而降低了翻譯速度和翻譯質量。
發明內容
本申請實施例的主要目的在于提供一種關鍵詞生成方法及裝置,通過生成關鍵詞來輔助翻譯人員進行后續翻譯,以提升翻譯人員的翻譯速度和翻譯質量。
本申請實施例提供了一種關鍵詞生成方法,包括:
獲取待翻譯的目標語音,并生成所述目標語音的識別文本;
提取所述識別文本中的各個關鍵詞,作為各個歷史關鍵詞;
生成各個聯想關鍵詞,所述各個聯想關鍵詞是與所述各個歷史關鍵詞具有強相關性的關鍵詞。
可選的,所述提取所述識別文本中的各個關鍵詞,包括:
根據詞匯的重要性和/或翻譯困難性,提取所述識別文本中的各個關鍵詞。
可選的,所述根據詞匯的重要性和/或翻譯困難性,提取所述識別文本中的各個關鍵詞,包括:
將所述識別文本中的各個第一詞匯,按照在所述識別文本中的出現順序進行排序,所述第一詞匯是重要詞匯和/或翻譯難度高的詞匯;
將所述識別文本中除各個第一詞匯以外的各個第二詞匯,按照詞匯的重要性進行排序;
將各個第二詞匯的排序結果串聯在各個第一詞匯的排序結果之后,提取串聯排序結果中的前N個詞匯,作為從所述識別文本中提取的各個關鍵詞。
可選的,所述生成各個聯想關鍵詞,包括:
將各個歷史關鍵詞與預先構建的關鍵詞對集合進行匹配,得到各個匹配關鍵詞對;其中,所述關鍵詞對集合包括各個目標關鍵詞對,所述目標關鍵詞對中的兩個關鍵詞具有強相關性,所述匹配關鍵詞對是包含歷史關鍵詞和候選關鍵詞的一個目標關鍵詞對;
將全部的候選關鍵詞作為各個聯想關鍵詞,或者,選取部分的候選關鍵詞作為各個聯想關鍵詞。
可選的,所述選取部分的候選關鍵詞作為各個聯想關鍵詞,包括:
根據各個匹配關鍵詞對的關鍵詞相關性,選取部分的候選關鍵詞作為各個聯想關鍵詞;
其中,所述關鍵詞相關性為對應的匹配關鍵詞對所包含的歷史關鍵詞和候選關鍵詞之間的相關性。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于科大訊飛股份有限公司,未經科大訊飛股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910344875.6/2.html,轉載請聲明來源鉆瓜專利網。





