日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]一種基于Transformer模型的機器翻譯模型優(yōu)化方法有效

專利信息
申請?zhí)枺?/td> 202110361317.8 申請日: 2021-04-02
公開(公告)號: CN113051938B 公開(公告)日: 2022-03-01
發(fā)明(設計)人: 孫亞楠;馮犇;吳杰;李思毅 申請(專利權)人: 四川大學
主分類號: G06F40/58 分類號: G06F40/58;G06F40/284;G06F40/253;G06F40/30;G06N3/00
代理公司: 北京正華智誠專利代理事務所(普通合伙) 11870 代理人: 代維凡
地址: 610064 四川*** 國省代碼: 四川;51
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 一種 基于 transformer 模型 機器翻譯 優(yōu)化 方法
【說明書】:

發(fā)明公開了一種基于Transformer模型的機器翻譯模型優(yōu)化方法,通過設計變長編碼和候選塊讓Transformer個體具有不同的結構和參數(shù),為詞向量的學習提供多種候選模型;而后設計了交叉變異策略讓Transformer個體能夠進行信息交流,讓處理詞向量的優(yōu)秀結構或參數(shù)可以遺傳給下一代;之后設計了環(huán)境選擇策略產(chǎn)生下一代Transformer個體,淘汰學習詞向量效果相對較差的模型,保留學習詞向量效果較為優(yōu)秀的模型;之后不斷迭代演化搜索找到學習詞向量效果最優(yōu)的Transformer模型,用于最終解決機器翻譯任務,使得Transformer模型能夠更好的學習機器翻譯任務中的詞向量表達,提高機器翻譯任務的精度。

技術領域

本發(fā)明涉及演化計算領域,具體涉及一種基于Transformer模型的機器翻譯模型優(yōu)化方法。

背景技術

Transformer是由谷歌再2017年提出的用于解決機器翻譯任務的一種序列到序列,在Transformer提出之前,機器翻譯模型可以分為兩類:基于回饋式神經(jīng)網(wǎng)絡的模型或者基于卷積的序列回歸模型。基于回饋式神經(jīng)網(wǎng)絡的模型大多由RNN或LSTM結構組成,模型中每一層中的輸入都依賴于前一層的輸出狀態(tài),這種順序計算約束導致基于回饋式神經(jīng)網(wǎng)絡的模型在訓練和預測過程中都需要耗費大量的時間和計算資源;基于卷積的網(wǎng)絡模型由多層卷積神經(jīng)網(wǎng)絡構成,這種模型在計算長距離信息的關系時卷積操作數(shù)會迅速增長,例如在ByteNet中是指數(shù)級增長。

Transformer利用多頭注意力機制(MHA)和前饋式神經(jīng)網(wǎng)絡(FFN)解決了上述兩個模型的缺點,可以通過更少的計算資源學習機器翻譯中的詞向量,獲取更高的翻譯精度。雖然Transformer模型已經(jīng)在機器翻譯中取得了很好地效果,但是其仍存在幾點問題:1.具有不同網(wǎng)絡層數(shù)的Transformer模型中MHA層和FFN層的排列模式是固定的,已有研究表明Transformer不同的層排列模式在其他自然語言處理任務上擁有比基礎Transformer模型更好的性能。2.Transformer模型每個層都擁有相同的參數(shù)。當使用Transformer執(zhí)行機器翻譯任務時,編碼器的較低層傾向于從詞向量中學習更多的語法知識,而較高的層則傾向于從詞向量中學習更多的語義。每個層設置成同樣的參數(shù)去學習不同角度的信息不符合神經(jīng)網(wǎng)絡設計的一般準則。3.Transformer模型的層數(shù)和超參數(shù)都是通過專家結合領域知識進行設置,如果非專業(yè)人員想要使用Transformer模型解決機器翻譯任務時很難獨立設計一個符合預期的模型。

針對上述問題,本方案設計了使用演化策略自動搜索Transformer模型參數(shù)和結構的方案,讓Transformer模型能夠更好的學習機器翻譯任務中的詞向量表達,提高機器翻譯任務的精度。在機器翻譯任務中,本方案構造的Transformer模型超過了現(xiàn)有的標準Transformer的性能。

發(fā)明內容

針對現(xiàn)有技術中的上述不足,本發(fā)明提供了一種基于Transformer模型的機器翻譯模型優(yōu)化方法。

為了達到上述發(fā)明目的,本發(fā)明采用的技術方案為:

一種基于Transformer模型的機器翻譯模型優(yōu)化方法,包括如下步驟:

S1、初始化具有多個不同結構和參數(shù)的Transformer模型的種群作為父代模型種群;

S2、利用BLEU算法計算所述父代模型種群中的每個Transformer模型詞向量學習能力評估指標;

S3、根據(jù)步驟S2的詞向量學習能力評估指標大小從父代模型種群中選擇父代個體,并使用交叉變異算子生成子代個體種群,同時利用BLEU算法計算子代個體種群中每個模型的詞向量學習能力評估指標;

S4、對所述父代個體和子代個體進行環(huán)境選擇生成新的模型種群,并根據(jù)所述步驟S2和步驟S3進行多輪迭代進化,直至滿足迭代終止條件;

S5、選擇最后一代中的最優(yōu)個體進行機器翻譯任務。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于四川大學,未經(jīng)四川大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202110361317.8/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產(chǎn)權局專利說明書;

2、支持發(fā)明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標識 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 久久免费福利视频| 肥大bbwbbwbbw高潮| 亚洲乱亚洲乱妇28p| 欧美国产一区二区三区激情无套| 91精品第一页| 在线观看国产91| 天天干狠狠插| 欧美日韩国产欧美| 亚州精品国产| 国语对白一区二区三区| 国产suv精品一区二区4| 午夜免费av电影| 日本午夜精品一区二区三区| 视频国产一区二区| 欧美67sexhd| 日韩一级在线视频| 超碰97国产精品人人cao| 精品国产亚洲一区二区三区| 99久久婷婷国产综合精品草原 | 亚洲欧美日韩综合在线| 国产精品99一区二区三区| 国产99久久九九精品| 国产一区日韩在线| 久久aⅴ国产欧美74aaa| 日韩欧美高清一区二区| 国产精品一二三四五区| 国产视频精品一区二区三区| 国产一区不卡视频| 19videosex性欧美69| 国产精品你懂的在线| 色噜噜狠狠色综合影视| 狠狠躁夜夜躁xxxxaaaa| 日韩一区免费| 国产99小视频| 97人人澡人人爽人人模亚洲| 久久99精品国产麻豆婷婷洗澡 | 亚洲精品国产91| 国91精品久久久久9999不卡| 国产高清在线精品一区二区三区| 欧美日韩亚洲三区| 午夜激情看片| 97人人澡人人添人人爽超碰| 97久久国产精品| 中文字幕制服狠久久日韩二区| 大bbw大bbw巨大bbb| 精品久久小视频| 久久99久国产精品黄毛片入口 | 亚洲乱码av一区二区三区中文在线: | 亚洲精品国产主播一区| 中文字幕欧美日韩一区| 狠狠色噜噜狠狠狠狠2021免费| 亚洲一区二区福利视频| 亚洲国产欧美国产综合一区| 国产91九色视频| 欧美一区二区三区在线视频播放| а√天堂8资源中文在线| 69精品久久| 欧美黄色片一区二区| 日本精品一区视频| 99久久国产综合精品女不卡| 日韩亚洲精品在线| 免费xxxx18美国| 欧美日韩一级二级| 欧美一区二区三区黄| 国产盗摄91精品一区二区三区| 亚洲va欧美va国产综合先锋| 午夜一级电影| 久久天天躁夜夜躁狠狠躁2022| 欧美一区二区三区另类| 国产亚洲精品久久网站| 一区二区国产盗摄色噜噜| 四虎久久精品国产亚洲av| sb少妇高潮二区久久久久| 91免费国产视频| 91精品一区在线观看| 日本少妇高潮xxxxⅹ| 国产一区午夜| 欧美一区二区三区免费视频| 中文字幕一区二区三区四| 97久久超碰国产精品| 91精品视频一区二区三区| 丰满岳乱妇在线观看中字|