[發(fā)明專利]基于語(yǔ)境迭代分析的漢譯英機(jī)器翻譯方法有效
| 申請(qǐng)?zhí)枺?/td> | 201810282274.2 | 申請(qǐng)日: | 2018-04-02 |
| 公開(kāi)(公告)號(hào): | CN108491399B | 公開(kāi)(公告)日: | 2021-08-06 |
| 發(fā)明(設(shè)計(jì))人: | 王路 | 申請(qǐng)(專利權(quán))人: | 上海杓衡信息科技有限公司 |
| 主分類號(hào): | G06F40/58 | 分類號(hào): | G06F40/58;G06F40/205;G06F40/253;G06F40/289 |
| 代理公司: | 北京世譽(yù)鑫誠(chéng)專利代理有限公司 11368 | 代理人: | 孫國(guó)棟 |
| 地址: | 200439 上海市寶山*** | 國(guó)省代碼: | 上海;31 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 語(yǔ)境 分析 漢譯英 機(jī)器翻譯 方法 | ||
1.基于語(yǔ)境迭代分析的漢譯英機(jī)器翻譯方法,其特征在于,包括:
(1)判斷是否有關(guān)鍵詞庫(kù)、專業(yè)術(shù)語(yǔ)庫(kù)、漢語(yǔ)常見(jiàn)關(guān)聯(lián)詞句式庫(kù)、漢語(yǔ)常見(jiàn)片語(yǔ)庫(kù)、帶有語(yǔ)境信息的單詞庫(kù)、統(tǒng)計(jì)機(jī)器翻譯模型,若缺少任一個(gè)庫(kù)或模型,進(jìn)入步驟(2),反之,進(jìn)入步驟(3);
(2)構(gòu)建1個(gè)關(guān)鍵詞庫(kù)、1個(gè)專業(yè)術(shù)語(yǔ)庫(kù)、1個(gè)漢語(yǔ)常見(jiàn)關(guān)聯(lián)詞句式庫(kù)、1個(gè)漢語(yǔ)常見(jiàn)片語(yǔ)庫(kù)、1個(gè)帶有語(yǔ)境信息的單詞庫(kù)和1個(gè)統(tǒng)計(jì)機(jī)器翻譯模型,構(gòu)建完畢后進(jìn)入步驟(3);
(21)構(gòu)建1個(gè)關(guān)鍵詞庫(kù)
從各個(gè)學(xué)科領(lǐng)域的論文中文摘要中提取關(guān)鍵詞,構(gòu)建各個(gè)學(xué)科領(lǐng)域的關(guān)鍵詞庫(kù),關(guān)鍵詞庫(kù)每個(gè)關(guān)鍵詞包含漢語(yǔ)關(guān)鍵詞、漢語(yǔ)關(guān)鍵詞英語(yǔ)譯文、漢語(yǔ)關(guān)鍵詞所屬學(xué)科三個(gè)字段;
(22)構(gòu)建1個(gè)專業(yè)術(shù)語(yǔ)庫(kù)
從各個(gè)學(xué)科領(lǐng)域的論文中文摘要中提取專業(yè)術(shù)語(yǔ),構(gòu)建各個(gè)學(xué)科領(lǐng)域的專業(yè)術(shù)語(yǔ)庫(kù),其中的每個(gè)專業(yè)術(shù)語(yǔ)包含漢語(yǔ)專業(yè)術(shù)語(yǔ)、漢語(yǔ)專業(yè)術(shù)語(yǔ)英語(yǔ)譯文、漢語(yǔ)專業(yè)術(shù)語(yǔ)所屬學(xué)科三個(gè)字段;
(23)構(gòu)建1個(gè)漢語(yǔ)常見(jiàn)關(guān)聯(lián)詞句式庫(kù)
從各個(gè)學(xué)科領(lǐng)域的論文中文摘要中分析常見(jiàn)的漢語(yǔ)關(guān)聯(lián)詞,形成漢語(yǔ)常見(jiàn)關(guān)聯(lián)詞句式庫(kù),其中的每個(gè)漢語(yǔ)常見(jiàn)關(guān)聯(lián)詞句式包含漢語(yǔ)常見(jiàn)關(guān)聯(lián)詞、漢語(yǔ)常見(jiàn)關(guān)聯(lián)詞句式、漢語(yǔ)常見(jiàn)關(guān)聯(lián)詞英語(yǔ)譯文三個(gè)字段;
(24)構(gòu)建1個(gè)漢語(yǔ)常見(jiàn)片語(yǔ)庫(kù)
對(duì)各學(xué)科領(lǐng)域的論文中文摘要進(jìn)行依存句法分析,統(tǒng)計(jì)出現(xiàn)頻率較高的片語(yǔ),并預(yù)先把片語(yǔ)中的特征詞語(yǔ)翻譯成英文,構(gòu)建漢語(yǔ)常見(jiàn)片語(yǔ)庫(kù),其中的每個(gè)漢語(yǔ)常見(jiàn)片語(yǔ)包含漢語(yǔ)片語(yǔ)特征詞、漢語(yǔ)片語(yǔ)模式、漢語(yǔ)片語(yǔ)特征詞英語(yǔ)譯文三個(gè)字段;
(25)構(gòu)建1個(gè)帶有語(yǔ)境信息的單詞庫(kù)
對(duì)各學(xué)科領(lǐng)域的論文中文摘要進(jìn)行依存句法分析,統(tǒng)計(jì)出具有高頻依存關(guān)系的詞對(duì),構(gòu)建帶有語(yǔ)境信息的單詞庫(kù);帶有語(yǔ)境信息的單詞庫(kù)包含漢語(yǔ)核心詞、核心詞語(yǔ)境、漢語(yǔ)核心詞英語(yǔ)譯文三個(gè)字段;
(26)構(gòu)建1個(gè)統(tǒng)計(jì)機(jī)器翻譯模型
借助聯(lián)合國(guó)中英平行語(yǔ)料庫(kù),對(duì)MOSES統(tǒng)計(jì)機(jī)器翻譯模型進(jìn)行訓(xùn)練,學(xué)習(xí)短語(yǔ)對(duì)短語(yǔ)的翻譯進(jìn)而構(gòu)建統(tǒng)計(jì)機(jī)器翻譯模型;
(3)接收待翻譯的論文的中文摘要,并對(duì)其進(jìn)行語(yǔ)境迭代翻譯
(31)對(duì)接收到的待翻譯的論文的中文摘要進(jìn)行篇章分析,確定待翻譯的論文的中文摘要所屬的學(xué)科領(lǐng)域,然后進(jìn)入步驟(32);
(32)依據(jù)步驟(23)創(chuàng)建的漢語(yǔ)常見(jiàn)關(guān)聯(lián)詞句式庫(kù),對(duì)接收到的待翻譯的論文的中文摘要,進(jìn)行句間語(yǔ)境分析,尋找?guī)в谐R?jiàn)的漢語(yǔ)關(guān)聯(lián)詞的句間語(yǔ)境;如果找到匹配的句間語(yǔ)境,則把句間語(yǔ)境中含有的漢語(yǔ)關(guān)聯(lián)詞替換成漢語(yǔ)關(guān)聯(lián)詞英語(yǔ)譯文,待翻譯的論文的中文摘要就轉(zhuǎn)換成為中英文的混合形式,然后進(jìn)入步驟(33);如果沒(méi)有找到匹配的句間語(yǔ)境,然后進(jìn)入步驟(33);
(33)把經(jīng)過(guò)步驟(32)處理的待翻譯的論文的中文摘要分解成多個(gè)句子語(yǔ)境,然后進(jìn)入步驟(34);
(34)逐一翻譯步驟(33)得到的句子語(yǔ)境,并將每一個(gè)句子語(yǔ)境的翻譯結(jié)果返回到篇章語(yǔ)境中,然后進(jìn)入步驟(35);
(35)在篇章語(yǔ)鏡中組合各個(gè)句子語(yǔ)境的翻譯結(jié)果,形成英文摘要;
(4)規(guī)整英文摘要
(41)對(duì)步驟(35)生成的英文摘要,每一句的首字母變成大寫(xiě)形式,然后進(jìn)入步驟(42);
(42)刪除步驟(41)處理的英文摘要中含有的多余的空格,并將標(biāo)點(diǎn)符號(hào)替換成英文標(biāo)點(diǎn);
(5)輸出英文摘要。
2.根據(jù)權(quán)利要求1所述的基于語(yǔ)境迭代分析的漢譯英機(jī)器翻譯方法,其特征在于,步驟(34)包括以下步驟:
(341)對(duì)句子語(yǔ)境進(jìn)行依存句法分析,獲得句子的依存結(jié)構(gòu),然后進(jìn)入步驟(342);
(342)根據(jù)步驟(341)得到的句子依存結(jié)構(gòu),把句子語(yǔ)境分解成若干句子成分語(yǔ)境,然后進(jìn)入步驟(343);
(343)逐一翻譯步驟(342)得到的句子成分語(yǔ)境,并將每一個(gè)句子成分語(yǔ)境的翻譯結(jié)果返回到句子語(yǔ)境中,然后進(jìn)入步驟(344);
(344)在句子語(yǔ)境中組合各個(gè)句子成分語(yǔ)境的翻譯結(jié)果,然后進(jìn)入步驟(345);
(345)把翻譯結(jié)果返回給篇章語(yǔ)境。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海杓衡信息科技有限公司,未經(jīng)上海杓衡信息科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810282274.2/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 用于管理語(yǔ)境相關(guān)信息的系統(tǒng)、移動(dòng)站、方法和計(jì)算機(jī)程序產(chǎn)品
- 文字輸入過(guò)程中的自動(dòng)校對(duì)方法
- 使用與信息關(guān)聯(lián)的語(yǔ)義語(yǔ)境便于協(xié)作搜索
- 記錄語(yǔ)境信息以及追溯生詞語(yǔ)境的方法和系統(tǒng)
- 基于語(yǔ)境的鍵盤(pán)
- 用于管理語(yǔ)音系統(tǒng)中的對(duì)話語(yǔ)境的系統(tǒng)和方法
- 用于管理語(yǔ)境相關(guān)信息的系統(tǒng)、移動(dòng)站和方法
- 減少主觀干擾內(nèi)容的方法和系統(tǒng)
- 依存句法樹(shù)構(gòu)建系統(tǒng)
- 會(huì)話語(yǔ)境劃分方法與系統(tǒng)、交互方法與交互系統(tǒng)





