[發(fā)明專利]篇章機(jī)器翻譯方法及裝置、存儲(chǔ)介質(zhì)在審
| 申請(qǐng)?zhí)枺?/td> | 202011031037.2 | 申請(qǐng)日: | 2020-09-27 |
| 公開(公告)號(hào): | CN112149432A | 公開(公告)日: | 2020-12-29 |
| 發(fā)明(設(shè)計(jì))人: | 李響;孫于惠;崔建偉 | 申請(qǐng)(專利權(quán))人: | 北京小米松果電子有限公司 |
| 主分類號(hào): | G06F40/58 | 分類號(hào): | G06F40/58;G06F40/30;G06F40/295;G06F40/216 |
| 代理公司: | 北京善任知識(shí)產(chǎn)權(quán)代理有限公司 11650 | 代理人: | 康艷青 |
| 地址: | 100085 北京市海淀*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 篇章 機(jī)器翻譯 方法 裝置 存儲(chǔ) 介質(zhì) | ||
1.一種篇章機(jī)器翻譯方法,其特征在于,所述方法包括:
識(shí)別篇章內(nèi)的實(shí)體詞;
將所述實(shí)體詞用占位符替換篇章內(nèi)原始語句,得到包含所述占位符的替換語句,其中,不同所述實(shí)體詞的占位符不同;
將所述替換語句和從所述原始語句抽取出的所述實(shí)體詞分別輸入到翻譯模型,得到所述替換語句的第一翻譯結(jié)果和所述實(shí)體詞的第二翻譯結(jié)果;
組合所述第一翻譯結(jié)果和所述第二翻譯結(jié)果,得到所述原始語句的翻譯結(jié)果。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括:
將所述替換語句與所述第一翻譯結(jié)果進(jìn)行比較,確定所述第一翻譯結(jié)果中缺失的占位符;
將所述替換語句和所述第一翻譯結(jié)果輸入到第一詞對(duì)齊模型,獲得所述缺失的占位符在所述第一翻譯結(jié)果中的對(duì)應(yīng)位置;其中,所述第一詞對(duì)齊模型為翻譯前語句中的詞對(duì)應(yīng)到翻譯后語句中的詞的對(duì)齊模型;
將所述缺失的占位符對(duì)應(yīng)的實(shí)體詞的第二翻譯結(jié)果插入到所述第一翻譯結(jié)果中的所述對(duì)應(yīng)位置,更新所述第一翻譯結(jié)果;
所述組合所述第一翻譯結(jié)果和所述第二翻譯結(jié)果,得到所述原始語句的翻譯結(jié)果,包括:
組合更新后的所述第一翻譯結(jié)果和所述第二翻譯結(jié)果,得到所述原始語句的翻譯結(jié)果。
3.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,所述方法還包括:
將用于訓(xùn)練的第一句子中的實(shí)體詞,以及所述第一句子對(duì)應(yīng)的翻譯后的第二句子中的實(shí)體詞,替換為相同的占位符;其中,所述第一句子或第二句子中的不同實(shí)體詞的占位符不同,所述第一句子或第二句子中相同含義的所述實(shí)體詞的占位符相同;
將所述第一句子以及用所述占位符替換后的第一句子輸入到神經(jīng)網(wǎng)絡(luò)模型,根據(jù)用于表征訓(xùn)練標(biāo)簽的所述第二句子和用所述占位符替換后的第二句子對(duì)所述神經(jīng)網(wǎng)絡(luò)模型中的參數(shù)進(jìn)行調(diào)整,獲得所述翻譯模型。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述將用于訓(xùn)練的第一句子中的實(shí)體詞,以及所述第一句子對(duì)應(yīng)的翻譯后的第二句子中的實(shí)體詞,替換為相同的占位符,包括:
將所述第一句子,以及所述第二句子輸入到第二詞對(duì)齊模型,獲得詞對(duì)齊結(jié)果;其中,所述第二詞對(duì)齊模型為翻譯前語句中的詞和翻譯后語句中的詞相互對(duì)齊的對(duì)齊模型;
若所述詞對(duì)齊結(jié)果表征所述第一句子中的實(shí)體詞與所述第二句子中的實(shí)體詞相互對(duì)齊,則將所述第一句子中的實(shí)體詞,以及所述第二句子中的實(shí)體詞,替換為相同的所述占位符。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述將所述實(shí)體詞用占位符替換篇章內(nèi)原始語句,得到包含所述占位符的替換語句,包括:
將所述實(shí)體詞中詞頻大于預(yù)設(shè)頻率的實(shí)體詞用所述占位符替換篇章內(nèi)的所述原始語句,得到包含所述占位符的所述替換語句。
6.根據(jù)權(quán)利要求5所述的方法,所述方法還包括:
若所述篇章內(nèi)不包括詞頻大于預(yù)設(shè)頻率的實(shí)體詞,則將所述原始語句輸入到所述翻譯模型,得到所述原始語句的翻譯結(jié)果。
7.一種篇章機(jī)器翻譯裝置,其特征在于,所述裝置包括:
識(shí)別模塊,配置為識(shí)別篇章內(nèi)的實(shí)體詞;
第一替換模塊,配置為將所述實(shí)體詞用占位符替換篇章內(nèi)原始語句,得到包含所述占位符的替換語句,其中,不同所述實(shí)體詞的占位符不同;
第一翻譯模塊,配置為將所述替換語句和從所述原始語句抽取出的所述實(shí)體詞分別輸入到翻譯模型,得到所述替換語句的第一翻譯結(jié)果和所述實(shí)體詞的第二翻譯結(jié)果;
組合模塊,配置為組合所述第一翻譯結(jié)果和所述第二翻譯結(jié)果,得到所述原始語句的翻譯結(jié)果。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京小米松果電子有限公司,未經(jīng)北京小米松果電子有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011031037.2/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 一種隱式篇章關(guān)系類型推理方法及系統(tǒng)
- 一種雙語篇章標(biāo)注方法
- 漢語篇章主次關(guān)系識(shí)別方法和系統(tǒng)
- 一種篇章連貫性的確定方法以及檢測(cè)裝置
- 篇章翻譯網(wǎng)絡(luò)的數(shù)據(jù)增強(qiáng)方法
- 一種基于篇章結(jié)構(gòu)圖卷積的隱式篇章關(guān)系分析方法和系統(tǒng)
- 篇章翻譯的方法、裝置、電子設(shè)備和可讀存儲(chǔ)介質(zhì)
- 篇章要點(diǎn)檢測(cè)方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 機(jī)器翻譯方法、裝置及存儲(chǔ)介質(zhì)
- 篇章解析方法、電子設(shè)備及存儲(chǔ)裝置
- 一種用于提高機(jī)器翻譯質(zhì)量的裝置和方法
- 機(jī)器翻譯方法和裝置
- 一種ERP術(shù)語機(jī)器翻譯方法
- 機(jī)器翻譯引擎推薦方法及裝置
- 神經(jīng)機(jī)器翻譯模型的訓(xùn)練方法、裝置及存儲(chǔ)介質(zhì)
- 基于機(jī)器翻譯引擎的翻譯方法及裝置
- 一種基于篇章的機(jī)器翻譯引擎測(cè)評(píng)優(yōu)選方法及系統(tǒng)
- 機(jī)器翻譯引擎服務(wù)恢復(fù)方法及裝置
- 一種基于預(yù)訓(xùn)練的稀缺資源神經(jīng)機(jī)器翻譯訓(xùn)練方法
- 基于混合策略的移動(dòng)設(shè)備機(jī)器翻譯系統(tǒng)
- 一種數(shù)據(jù)庫讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





