[發(fā)明專利]多譯員模式下翻譯知識(shí)有效性判別方法在審
| 申請(qǐng)?zhí)枺?/td> | 201710877029.1 | 申請(qǐng)日: | 2017-09-25 |
| 公開(kāi)(公告)號(hào): | CN107885730A | 公開(kāi)(公告)日: | 2018-04-06 |
| 發(fā)明(設(shè)計(jì))人: | 葉娜 | 申請(qǐng)(專利權(quán))人: | 沈陽(yáng)航空航天大學(xué) |
| 主分類號(hào): | G06F17/28 | 分類號(hào): | G06F17/28 |
| 代理公司: | 沈陽(yáng)優(yōu)普達(dá)知識(shí)產(chǎn)權(quán)代理事務(wù)所(特殊普通合伙)21234 | 代理人: | 李曉光 |
| 地址: | 110136 遼寧省沈*** | 國(guó)省代碼: | 遼寧;21 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 譯員 模式 翻譯 知識(shí) 有效性 判別 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及一種翻譯知識(shí)有效性判別技術(shù),具體為一種多譯員模式下翻譯知識(shí)有效性判別方法。
背景技術(shù)
隨著信息技術(shù)的進(jìn)步和全球一體化步伐的加快,跨語(yǔ)種交流的語(yǔ)言障礙問(wèn)題日益突出,對(duì)高效翻譯方法的需求愈加緊迫。為了解決這一問(wèn)題,人們開(kāi)展了機(jī)器翻譯的研究,旨在使計(jì)算機(jī)能夠代替人類進(jìn)行全自動(dòng)翻譯。
經(jīng)過(guò)數(shù)十年的探索,盡管機(jī)器翻譯技術(shù)取得了長(zhǎng)足進(jìn)展,目前的機(jī)器翻譯系統(tǒng)所產(chǎn)生的譯文仍然無(wú)法達(dá)到直接可用的程度。在這樣的背景下,一些研究人員開(kāi)始尋求翻譯思想的改變,由全自動(dòng)翻譯轉(zhuǎn)向人機(jī)交互翻譯。在該模式下,機(jī)器翻譯引擎產(chǎn)生的譯文作為輔助譯文提供給人類譯員,譯員通過(guò)各種交互行為,對(duì)系統(tǒng)進(jìn)行反饋指導(dǎo),直至產(chǎn)生正確譯文。
在交互式機(jī)器翻譯系統(tǒng)中,根據(jù)譯員對(duì)輔助譯文的反饋,自動(dòng)學(xué)習(xí)翻譯知識(shí),來(lái)優(yōu)化機(jī)器翻譯引擎,是一種普遍采用的技術(shù)。近年來(lái),隨著翻譯規(guī)模的擴(kuò)大,譯員數(shù)量不斷增加。不同譯員面對(duì)相同的源語(yǔ)句可能做出不同的反饋和指導(dǎo),導(dǎo)致機(jī)器翻譯引擎學(xué)習(xí)到相互沖突的翻譯知識(shí)。現(xiàn)有方法通過(guò)基于頻度的概率估計(jì)來(lái)解決這一問(wèn)題,對(duì)出現(xiàn)頻度較高的翻譯知識(shí)賦予更高的概率值,隱性假設(shè)不同譯員的翻譯知識(shí)具有相同的有效性。
實(shí)際上,譯員的翻譯水平和經(jīng)驗(yàn)存在很大差別,他們所提供指導(dǎo)的有效性也應(yīng)有所區(qū)別。而現(xiàn)有方法無(wú)法判別來(lái)自不同譯員的翻譯知識(shí)的有效性,使機(jī)器翻譯引擎的優(yōu)化效果受到限制。
發(fā)明內(nèi)容
針對(duì)現(xiàn)有技術(shù)中交互式機(jī)器翻譯系統(tǒng)存在的多譯員翻譯決策沖突導(dǎo)致機(jī)器翻譯引擎的優(yōu)化效果受到限制等不足,本發(fā)明要解決的問(wèn)題是提供一種可實(shí)現(xiàn)不同譯員翻譯知識(shí)的有效融合、改善翻譯引擎的優(yōu)化效果的多譯員模式下翻譯知識(shí)有效性判別方法。
為解決上述技術(shù)問(wèn)題,本發(fā)明采用的技術(shù)方案是:
本發(fā)明一種多譯員模式下翻譯知識(shí)有效性判別方法,包括以下步驟:
1)數(shù)據(jù)采集,實(shí)時(shí)采集譯員翻譯過(guò)程中的任務(wù)接受時(shí)間、任務(wù)提交時(shí)間、翻譯行為、翻譯實(shí)例以及質(zhì)檢結(jié)果基礎(chǔ)數(shù)據(jù);
2)統(tǒng)計(jì)分析,從基礎(chǔ)數(shù)據(jù)中統(tǒng)計(jì)出譯員翻譯過(guò)程中的平均翻譯速度、翻譯速度波動(dòng)系數(shù)、平均翻譯質(zhì)量、翻譯質(zhì)量波動(dòng)系數(shù)、翻譯總量、常用句式、常用詞匯/短語(yǔ)、常用工具、常用行為、檢索記錄和錯(cuò)誤類別特征;
3)特征選擇,考察上述各類特征與翻譯知識(shí)有效性之間的關(guān)聯(lián)情況,篩選出具有最高關(guān)聯(lián)度的m個(gè)特征;
4)翻譯知識(shí)有效性評(píng)估,對(duì)譯員的翻譯知識(shí)有效性進(jìn)行打分。
步驟3)中,特征選擇包括以下步驟:
31)從步驟2)中統(tǒng)計(jì)出的特征里提取影響譯員翻譯知識(shí)有效性的特征集合F;
32)以翻譯質(zhì)量Q為評(píng)價(jià)指標(biāo),計(jì)算特征集合F中各因素與Q之間的關(guān)聯(lián)度;
33)從特征集合F中篩選出具有最高關(guān)聯(lián)度的m個(gè)特征。
計(jì)算特征集合F中各因素與Q之間的關(guān)聯(lián)度為:采用點(diǎn)式互信息、DICE系數(shù)、卡方統(tǒng)計(jì)值或?qū)?shù)可能性分值度量方法。
采用加權(quán)求和的方法評(píng)價(jià)譯員u在時(shí)刻t的翻譯知識(shí)有效性分?jǐn)?shù),評(píng)價(jià)公式為:
其中,m為影響翻譯知識(shí)有效性的特征數(shù)量,Dj(u,t)為t時(shí)刻譯員u的特征值,λ為特征的權(quán)重,通過(guò)最小化錯(cuò)誤率訓(xùn)練得到。
最小化錯(cuò)誤率訓(xùn)練為:
401)構(gòu)建訓(xùn)練數(shù)據(jù)集,提取譯員在某一時(shí)刻t的各項(xiàng)特征值,組成特征向量Vt,人工標(biāo)注譯員當(dāng)時(shí)的翻譯有效性分?jǐn)?shù)St,構(gòu)成一個(gè)訓(xùn)練實(shí)例<Vt,St>,多個(gè)訓(xùn)練實(shí)例構(gòu)成訓(xùn)練數(shù)據(jù)集;
402)在該訓(xùn)練數(shù)據(jù)集上進(jìn)行參數(shù)訓(xùn)練,確定每個(gè)特征的最優(yōu)權(quán)重
403)根據(jù)譯員的特征向量及其對(duì)應(yīng)的最優(yōu)權(quán)重,對(duì)譯員的翻譯知識(shí)有效性進(jìn)行打分。
本發(fā)明具有以下有益效果及優(yōu)點(diǎn):
1.本發(fā)明為多譯員模式下翻譯知識(shí)的有效性判別提供了方法,通過(guò)分析譯員的翻譯狀態(tài),來(lái)評(píng)價(jià)系統(tǒng)從譯員反饋中學(xué)到的翻譯知識(shí)的有效性,有助于解決來(lái)自不同譯員反饋的翻譯知識(shí)存在沖突的問(wèn)題,實(shí)現(xiàn)不同譯員翻譯知識(shí)的有效融合,改善翻譯引擎的優(yōu)化效果,降低人機(jī)交互代價(jià),提高翻譯效率。
附圖說(shuō)明
圖1為本發(fā)明翻譯知識(shí)有效性判別及應(yīng)用過(guò)程圖示。
具體實(shí)施方式
下面結(jié)合說(shuō)明書附圖對(duì)本發(fā)明作進(jìn)一步闡述。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于沈陽(yáng)航空航天大學(xué),未經(jīng)沈陽(yáng)航空航天大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710877029.1/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 上一篇:一種電力施工緊線裝置
- 下一篇:電纜雙滾輪收放機(jī)構(gòu)
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語(yǔ)言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫(kù)結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 一種構(gòu)建多語(yǔ)言網(wǎng)站實(shí)時(shí)翻譯的方法
- 一種待翻譯軟件的翻譯方法及裝置
- 一種待翻譯軟件的翻譯方法及裝置
- 一種CAT系統(tǒng)中翻譯記憶庫(kù)和MT結(jié)合的方法及系統(tǒng)
- 翻譯方法、系統(tǒng)、終端以及存儲(chǔ)介質(zhì)
- 一種文本展示方法及裝置
- 機(jī)器翻譯方法及裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 基于機(jī)器翻譯引擎的翻譯方法及裝置
- 翻譯系統(tǒng)、翻譯方法、翻譯機(jī)及存儲(chǔ)介質(zhì)
- 文字翻譯方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 基于本體的知識(shí)地圖繪制系統(tǒng)
- 基于知識(shí)地圖的領(lǐng)域知識(shí)瀏覽方法
- 一種基于知識(shí)本體的知識(shí)體系的建模方法
- 一種知識(shí)工程系統(tǒng)
- 知識(shí)自動(dòng)化系統(tǒng)和方法以及存儲(chǔ)器
- 基于SOLR的知識(shí)管理系統(tǒng)
- 基于知識(shí)節(jié)點(diǎn)所屬度的知識(shí)圖譜構(gòu)建方法和裝置
- 一種基于知識(shí)圖譜的稅務(wù)知識(shí)庫(kù)系統(tǒng)
- 一種智聯(lián)網(wǎng)中的網(wǎng)絡(luò)知識(shí)統(tǒng)一表征架構(gòu)及實(shí)現(xiàn)方法
- 知識(shí)點(diǎn)存儲(chǔ)方法、裝置、服務(wù)器及介質(zhì)





