[發(fā)明專利]神經(jīng)機(jī)器翻譯中注意力參數(shù)的修正方法、裝置及電子設(shè)備有效
| 申請(qǐng)?zhí)枺?/td> | 201710252048.5 | 申請(qǐng)日: | 2017-04-17 |
| 公開(kāi)(公告)號(hào): | CN108733657B | 公開(kāi)(公告)日: | 2022-10-28 |
| 發(fā)明(設(shè)計(jì))人: | 程善伯;王宇光;姜里羊;陳偉;王硯峰 | 申請(qǐng)(專利權(quán))人: | 北京搜狗科技發(fā)展有限公司 |
| 主分類號(hào): | G06F40/58 | 分類號(hào): | G06F40/58;G06F40/45;G06N3/08 |
| 代理公司: | 北京華沛德權(quán)律師事務(wù)所 11302 | 代理人: | 馬苗苗 |
| 地址: | 100084 北京市海淀區(qū)中關(guān)*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 神經(jīng) 機(jī)器翻譯 注意力 參數(shù) 修正 方法 裝置 電子設(shè)備 | ||
1.一種神經(jīng)機(jī)器翻譯中注意力參數(shù)的修正方法,其特征在于,所述方法包括:
獲得第t時(shí)刻待翻譯的源端詞的編碼向量,t為大于等于1的整數(shù);
獲得第t-1時(shí)刻翻譯獲得的目標(biāo)端詞的隱狀態(tài)向量、所述第t-1時(shí)刻所述源端詞的覆蓋率,以及所述源端詞與所述目標(biāo)端詞之間的詞對(duì)齊概率;
基于所述詞對(duì)齊概率,對(duì)所述覆蓋率進(jìn)行修正獲得修正后的所述覆蓋率;
基于修正后的所述覆蓋率、所述編碼向量及所述隱狀態(tài)向量,計(jì)算獲得神經(jīng)機(jī)器翻譯過(guò)程中的注意力參數(shù);
基于所述注意力參數(shù)進(jìn)行機(jī)器翻譯;
所述基于所述詞對(duì)齊概率,對(duì)所述覆蓋率進(jìn)行修正獲得修正后的所述覆蓋率,包括通過(guò)如下公式獲得修正后的所述覆蓋率:
C′i-1,j=Ci-1,j*Ai-1,j或者
C'i-1,j=Ci-1,j*exp(Ai-1,j)
其中,Ci-1,j表示所述覆蓋率,C'i-1,j表示修正后的所述覆蓋率,Ai-1,j表示所述詞對(duì)齊概率,i表示目標(biāo)端翻譯獲得的第i個(gè)詞,j表示源端待翻譯的第j個(gè)詞;或者,
所述基于所述詞對(duì)齊概率,對(duì)所述覆蓋率進(jìn)行修正獲得修正后的所述覆蓋率,包括通過(guò)如下公式獲得修正后的所述覆蓋率:
C′i-1,j=softmax(Ci-1,j*Ai-1,j)或者
C′i-1,j=softmax(Ci-1,j*exp(Ai-1,j))
其中,Ci-1,j表示所述覆蓋率,C'i-1,j表示修正后的所述覆蓋率,Ai-1,j表示所述詞對(duì)齊概率,softmax表示歸一化指數(shù)函數(shù),i表示目標(biāo)端翻譯獲得的第i個(gè)詞,j表示源端待翻譯的第j個(gè)詞;
所述基于修正后的所述覆蓋率、所述編碼向量及所述隱狀態(tài)向量,計(jì)算獲得神經(jīng)機(jī)器翻譯過(guò)程中的注意力參數(shù),包括:
基于修正后的所述覆蓋率、所述編碼向量及所述隱狀態(tài)向量,計(jì)算獲得所述源端詞對(duì)應(yīng)所述目標(biāo)端詞的權(quán)重;對(duì)所述權(quán)重進(jìn)行歸一化,獲得所述神經(jīng)機(jī)器翻譯過(guò)程中的所述注意力參數(shù)。
2.如權(quán)利要求1所述的方法,其特征在于,所述基于所述詞對(duì)齊概率,對(duì)所述覆蓋率進(jìn)行修正獲得修正后的所述覆蓋率,包括:
基于所述詞對(duì)齊概率的大小來(lái)修正所述覆蓋率的大小,所述詞對(duì)齊概率越大修正后的所述覆蓋率越大,所述詞對(duì)齊概率越小修正后的所述覆蓋率越小。
3.如權(quán)利要求1所述的方法,其特征在于,所述基于修正后的所述覆蓋率、所述編碼向量及所述隱狀態(tài)向量,計(jì)算獲得所述源端詞對(duì)應(yīng)所述目標(biāo)端詞的權(quán)重,包括:
其中,ei,j表示所述源端詞對(duì)應(yīng)所述目標(biāo)端詞的權(quán)重,ti-1表示所述隱狀態(tài)向量,hj表示所述編碼向量,Wa、Ua、Uc表示神經(jīng)機(jī)器翻譯中的四個(gè)權(quán)值矩陣,i表示目標(biāo)端翻譯獲得的第i個(gè)詞,j表示源端待翻譯的第j個(gè)詞。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京搜狗科技發(fā)展有限公司,未經(jīng)北京搜狗科技發(fā)展有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710252048.5/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 用于治療支氣管樹(shù)的系統(tǒng)、組件和方法
- 一種頸部神經(jīng)信號(hào)記錄方法
- 用于在激活褐色脂肪組織時(shí)抑制神經(jīng)的方法和裝置
- 一種神經(jīng)元硬件裝置及用這種裝置模擬脈沖神經(jīng)網(wǎng)絡(luò)的方法
- 神經(jīng)移植物及應(yīng)用其的神經(jīng)移植物系統(tǒng)
- 一種神經(jīng)疏通緩解裝置
- 神經(jīng)移植物及應(yīng)用其的神經(jīng)移植物系統(tǒng)
- 一種模擬神經(jīng)網(wǎng)芯片的設(shè)計(jì)方法及模擬神經(jīng)網(wǎng)芯片
- 神經(jīng)網(wǎng)絡(luò)的剪枝方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一套無(wú)人機(jī)神經(jīng)網(wǎng)絡(luò)控制用的人工神經(jīng)元模型
- 一種用于提高機(jī)器翻譯質(zhì)量的裝置和方法
- 機(jī)器翻譯方法和裝置
- 一種ERP術(shù)語(yǔ)機(jī)器翻譯方法
- 機(jī)器翻譯引擎推薦方法及裝置
- 神經(jīng)機(jī)器翻譯模型的訓(xùn)練方法、裝置及存儲(chǔ)介質(zhì)
- 基于機(jī)器翻譯引擎的翻譯方法及裝置
- 一種基于篇章的機(jī)器翻譯引擎測(cè)評(píng)優(yōu)選方法及系統(tǒng)
- 機(jī)器翻譯引擎服務(wù)恢復(fù)方法及裝置
- 一種基于預(yù)訓(xùn)練的稀缺資源神經(jīng)機(jī)器翻譯訓(xùn)練方法
- 基于混合策略的移動(dòng)設(shè)備機(jī)器翻譯系統(tǒng)
- 基于粒子濾波視覺(jué)注意力模型的運(yùn)動(dòng)目標(biāo)檢測(cè)方法
- 一種評(píng)測(cè)注意力狀態(tài)的方法及裝置
- 注意力測(cè)評(píng)方法、系統(tǒng)及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 兒童注意力評(píng)估系統(tǒng)及其方法
- 一種注意力檢測(cè)方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種注意力識(shí)別方法和裝置
- 一種可靠的用戶注意力監(jiān)測(cè)估計(jì)表示模型
- 注意力特征圖獲取方法及裝置、目標(biāo)檢測(cè)的方法及裝置
- 基于通道增強(qiáng)的雙注意力生成對(duì)抗網(wǎng)絡(luò)及圖像生成方法
- 一種文本情感分析模型的優(yōu)化方法及裝置





