[發(fā)明專利]包含術(shù)語翻譯的機(jī)器翻譯方法、裝置與電子設(shè)備有效
| 申請?zhí)枺?/td> | 201910831775.6 | 申請日: | 2019-09-04 |
| 公開(公告)號: | CN110543644B | 公開(公告)日: | 2023-08-29 |
| 發(fā)明(設(shè)計)人: | 蔡潔 | 申請(專利權(quán))人: | 語聯(lián)網(wǎng)(武漢)信息技術(shù)有限公司 |
| 主分類號: | G06F40/58 | 分類號: | G06F40/58;G06F40/289;G06F40/242 |
| 代理公司: | 北京路浩知識產(chǎn)權(quán)代理有限公司 11002 | 代理人: | 苗曉靜 |
| 地址: | 430206 湖北省武漢市東湖新技術(shù)開*** | 國省代碼: | 湖北;42 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 包含 術(shù)語 翻譯 機(jī)器翻譯 方法 裝置 電子設(shè)備 | ||
1.一種包含術(shù)語翻譯的機(jī)器翻譯方法,其特征在于,包括:
將待翻譯文本按句進(jìn)行分詞處理,并將分詞的結(jié)果與給定術(shù)語庫進(jìn)行術(shù)語匹配,確定所述待翻譯文本中的術(shù)語,所述給定術(shù)語庫內(nèi)存儲有源語言和目標(biāo)語言術(shù)語對;
將所述待翻譯文本中的術(shù)語用占位符進(jìn)行替換,并基于所述給定術(shù)語庫,利用預(yù)先建立的目標(biāo)機(jī)器翻譯模型,對所述替換后的待翻譯文本進(jìn)行翻譯和術(shù)語替換,獲取包含術(shù)語譯文的翻譯結(jié)果;
在所述利用預(yù)先建立的目標(biāo)機(jī)器翻譯模型,對所述替換后的待翻譯文本進(jìn)行翻譯和術(shù)語替換的步驟之前,還包括:
對訓(xùn)練語料句對進(jìn)行分詞處理,并根據(jù)分詞結(jié)果依次進(jìn)行詞對齊處理和詞性標(biāo)注;
確定術(shù)語因子數(shù),并基于所述術(shù)語因子數(shù)和詞性標(biāo)注的結(jié)果,對所述訓(xùn)練語料句對獲取帶占位符的訓(xùn)練樣本句對;
利用所述帶占位符的訓(xùn)練樣本句對,訓(xùn)練初始化完成的seq2seq?with?attention模型,獲取所述目標(biāo)機(jī)器翻譯模型;
所述基于所述術(shù)語因子數(shù)和詞性標(biāo)注的結(jié)果,對所述訓(xùn)練語料句對獲取帶占位符的訓(xùn)練樣本句對,包括:
根據(jù)1到所述術(shù)語因子數(shù)取組合的數(shù)量,利用占位符替換訓(xùn)練語料句子中的給定詞性的詞,生成所述帶占位符的訓(xùn)練樣本句對。
2.根據(jù)權(quán)利要求1所述的包含術(shù)語翻譯的機(jī)器翻譯方法,其特征在于,所述對所述替換后的待翻譯文本進(jìn)行翻譯和術(shù)語替換的步驟具體包括:
將所述替換后的待翻譯文本輸入所述目標(biāo)機(jī)器翻譯模型,獲取帶占位符的譯文中間結(jié)果,并基于所述給定術(shù)語庫,獲取所述待翻譯文本中的術(shù)語對應(yīng)的術(shù)語譯文;
利用所述術(shù)語譯文替換所述帶占位符的譯文中間結(jié)果中的占位符,實現(xiàn)譯文術(shù)語替換。
3.根據(jù)權(quán)利要求1所述的包含術(shù)語翻譯的機(jī)器翻譯方法,其特征在于,進(jìn)行詞性標(biāo)注的步驟具體包括:
利用隱馬爾科夫模型viterbi算法,對詞對齊處理的結(jié)果進(jìn)行給定類型的分詞的詞性標(biāo)注。
4.根據(jù)權(quán)利要求1所述的包含術(shù)語翻譯的機(jī)器翻譯方法,其特征在于,具體基于cedar雙數(shù)組字典樹算法,實現(xiàn)所述術(shù)語匹配。
5.根據(jù)權(quán)利要求1所述的包含術(shù)語翻譯的機(jī)器翻譯方法,其特征在于,具體采用Stanford?CoreNLP工具,實現(xiàn)所述分詞處理。
6.一種包含術(shù)語翻譯的機(jī)器翻譯裝置,其特征在于,包括:
術(shù)語匹配模塊,用于將待翻譯文本按句進(jìn)行分詞處理,并將分詞的結(jié)果與給定術(shù)語庫進(jìn)行術(shù)語匹配,確定所述待翻譯文本中的術(shù)語,所述給定術(shù)語庫內(nèi)存儲有源語言和目標(biāo)語言術(shù)語對;
術(shù)語替換翻譯模塊,用于將所述待翻譯文本中的術(shù)語用占位符進(jìn)行替換,并基于所述給定術(shù)語庫,利用預(yù)先建立的目標(biāo)機(jī)器翻譯模型,對所述替換后的待翻譯文本進(jìn)行翻譯和術(shù)語替換,獲取包含術(shù)語譯文的翻譯結(jié)果;
所述裝置還包括模型訓(xùn)練模塊,用于,
對訓(xùn)練語料句對進(jìn)行分詞處理,并根據(jù)分詞結(jié)果依次進(jìn)行詞對齊處理和詞性標(biāo)注;
確定術(shù)語因子數(shù),并基于所述術(shù)語因子數(shù)和詞性標(biāo)注的結(jié)果,對所述訓(xùn)練語料句對獲取帶占位符的訓(xùn)練樣本句對;
利用所述帶占位符的訓(xùn)練樣本句對,訓(xùn)練初始化完成的seq2seq?with?attention模型,獲取所述目標(biāo)機(jī)器翻譯模型;
所述基于所述術(shù)語因子數(shù)和詞性標(biāo)注的結(jié)果,對所述訓(xùn)練語料句對獲取帶占位符的訓(xùn)練樣本句對,包括:
根據(jù)1到所述術(shù)語因子數(shù)取組合的數(shù)量,利用占位符替換訓(xùn)練語料句子中的給定詞性的詞,生成所述帶占位符的訓(xùn)練樣本句對。
7.一種電子設(shè)備,包括存儲器、處理器及存儲在所述存儲器上并可在所述處理器上運行的計算機(jī)程序,其特征在于,所述處理器執(zhí)行所述計算機(jī)程序時,實現(xiàn)如權(quán)利要求1至5中任一項所述的包含術(shù)語翻譯的機(jī)器翻譯方法的步驟。
8.一種非暫態(tài)計算機(jī)可讀存儲介質(zhì),其上存儲有計算機(jī)指令,其特征在于,所述計算機(jī)指令被計算機(jī)執(zhí)行時,實現(xiàn)如權(quán)利要求1至5中任一項所述的包含術(shù)語翻譯的機(jī)器翻譯方法的步驟。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于語聯(lián)網(wǎng)(武漢)信息技術(shù)有限公司,未經(jīng)語聯(lián)網(wǎng)(武漢)信息技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910831775.6/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 一種領(lǐng)域術(shù)語抽取的方法
- 醫(yī)學(xué)術(shù)語識別方法及裝置
- 術(shù)語抽取方法和裝置
- 一種醫(yī)療術(shù)語知識庫完善的方法和裝置
- 一種構(gòu)建制造領(lǐng)域術(shù)語庫的方法及系統(tǒng)
- 術(shù)語更新方法以及相關(guān)設(shè)備、裝置
- 一種醫(yī)學(xué)術(shù)語系統(tǒng)的構(gòu)建方法、裝置、設(shè)備及存儲介質(zhì)
- 一種基于多特征的術(shù)語檢索方法
- 一種術(shù)語替換方法及系統(tǒng)
- 一種標(biāo)準(zhǔn)術(shù)語確定方法、裝置及存儲介質(zhì)





