[發(fā)明專利]多語(yǔ)機(jī)器翻譯智能輔助處理方法和系統(tǒng)有效
| 申請(qǐng)?zhí)枺?/td> | 201210410530.4 | 申請(qǐng)日: | 2012-10-24 |
| 公開(公告)號(hào): | CN102968411A | 公開(公告)日: | 2013-03-13 |
| 發(fā)明(設(shè)計(jì))人: | 滕志揚(yáng);駱衛(wèi)華;劉群;熊皓 | 申請(qǐng)(專利權(quán))人: | 橙譯中科信息技術(shù)(北京)有限公司 |
| 主分類號(hào): | G06F17/28 | 分類號(hào): | G06F17/28;G06F17/27 |
| 代理公司: | 廣州華進(jìn)聯(lián)合專利商標(biāo)代理有限公司 44224 | 代理人: | 陳振 |
| 地址: | 100190 北京市海淀區(qū)中關(guān)村*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 機(jī)器翻譯 智能 輔助 處理 方法 系統(tǒng) | ||
1.一種多語(yǔ)機(jī)器翻譯智能輔助處理方法,其特征在于,包括如下步驟:
步驟S100,根據(jù)源語(yǔ)言和已翻譯目標(biāo)語(yǔ)言獲取源語(yǔ)言已翻譯的區(qū)間,對(duì)源語(yǔ)言未翻譯的區(qū)間進(jìn)行擴(kuò)展;
步驟S200,根據(jù)源語(yǔ)言未翻譯的區(qū)間擴(kuò)展,生成K-best提示集;并根據(jù)源語(yǔ)言未翻譯的區(qū)間和已翻譯目標(biāo)語(yǔ)言生成輸入歷史提示集和語(yǔ)言模型提示集;
步驟S300,結(jié)合輸入歷史提示集、語(yǔ)言模型提示集、以及K-best提示集,生成所述源語(yǔ)言未翻譯源區(qū)間對(duì)應(yīng)的目標(biāo)語(yǔ)言的候選集。
2.根據(jù)權(quán)利要求1所述的多語(yǔ)機(jī)器翻譯智能輔助處理方法,其特征在于,所述步驟S300之后還包括如下步驟:
步驟S400,顯示所述目標(biāo)語(yǔ)言的候選集,等待用戶輸入或者選擇,并在捕捉到用戶輸入或者選擇動(dòng)作后,得到未翻譯源語(yǔ)言翻譯對(duì)應(yīng)的目標(biāo)語(yǔ)言,返回到步驟S100重新進(jìn)行未翻譯源語(yǔ)言翻譯,直至翻譯完成。
3.根據(jù)權(quán)利要求1或2所述的多語(yǔ)機(jī)器翻譯智能輔助處理方法,其特征在于,所述步驟S100包括如下步驟:
步驟S110,設(shè)已翻譯目標(biāo)語(yǔ)言集E=e1...em(m>=1),則確定一個(gè)E的劃分S:{(a,b)|1=<a<=b<=m},對(duì)于任意的一個(gè)元素(a,b)屬于S,計(jì)算確定一個(gè)源語(yǔ)言集對(duì)應(yīng)的區(qū)間(a',b')的集合T,得到已翻譯源語(yǔ)言區(qū)間集合;
步驟S120,將集合T的每一個(gè)區(qū)間序列作為一個(gè)實(shí)例采用語(yǔ)言模型解碼方法采用不同的短語(yǔ)特征對(duì)對(duì)應(yīng)的源語(yǔ)言未翻譯的區(qū)間進(jìn)行擴(kuò)展。
4.根據(jù)權(quán)利要求3所述的多語(yǔ)機(jī)器翻譯智能輔助處理方法,其特征在于,所述步驟S110包括如下步驟:
步驟S111,設(shè)源語(yǔ)言的詞序列為c1...cn;目標(biāo)語(yǔ)言已翻譯的詞序列為e1...em,其中,n、m為整數(shù);
步驟S112,枚舉區(qū)間[1,m]的所有可能劃分,得到集合S;
步驟S113,根據(jù)已翻譯源語(yǔ)言從語(yǔ)言模型集中檢索獲取所有可能的候選目標(biāo)翻譯語(yǔ)言短語(yǔ)集合P;
步驟S114,對(duì)于集合S中的每一個(gè)可能劃分s,設(shè)置一個(gè)臨時(shí)的集合D,對(duì)于劃分s中的任意一個(gè)元素[a,b],1=<a<=b<=m;
步驟S115,對(duì)于P中的任意一個(gè)原始元素p,查找與ea...eb最相似的類似元素p*;
步驟S116,根據(jù)類似元素p*,查找到類似元素p*對(duì)應(yīng)的源語(yǔ)言的區(qū)間d,將d加入到D中;
步驟S?117,判斷D是否有重疊元素,如無,則將D加入到已翻譯源語(yǔ)言區(qū)間集合T中,直至S中所有元素的劃分完成。
5.根據(jù)權(quán)利要求1或2所述的多語(yǔ)機(jī)器翻譯智能輔助處理方法,其特征在于,所述步驟S200中,根據(jù)源語(yǔ)言未翻譯的區(qū)間擴(kuò)展,生成K-best提示集,包括如下步驟:
步驟S210,根據(jù)未翻譯的區(qū)間擴(kuò)展,獲取源語(yǔ)言未翻譯的區(qū)間對(duì)應(yīng)的翻譯結(jié)果中前K個(gè)最好的結(jié)果,其中,K為大于等于0的整數(shù);
步驟S220,將前K個(gè)最好的結(jié)果作為K-best提示集中的提示的字符串,并計(jì)算所述K個(gè)K-best提示集中的提示的字符串對(duì)應(yīng)的概率,將提示的類型設(shè)置為2,生成K-best提示集。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于橙譯中科信息技術(shù)(北京)有限公司,未經(jīng)橙譯中科信息技術(shù)(北京)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210410530.4/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語(yǔ)言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫(kù)結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 一種用于提高機(jī)器翻譯質(zhì)量的裝置和方法
- 機(jī)器翻譯方法和裝置
- 一種ERP術(shù)語(yǔ)機(jī)器翻譯方法
- 機(jī)器翻譯引擎推薦方法及裝置
- 神經(jīng)機(jī)器翻譯模型的訓(xùn)練方法、裝置及存儲(chǔ)介質(zhì)
- 基于機(jī)器翻譯引擎的翻譯方法及裝置
- 一種基于篇章的機(jī)器翻譯引擎測(cè)評(píng)優(yōu)選方法及系統(tǒng)
- 機(jī)器翻譯引擎服務(wù)恢復(fù)方法及裝置
- 一種基于預(yù)訓(xùn)練的稀缺資源神經(jīng)機(jī)器翻譯訓(xùn)練方法
- 基于混合策略的移動(dòng)設(shè)備機(jī)器翻譯系統(tǒng)





