日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]面向神經(jīng)機器翻譯的數(shù)據(jù)縮減方法在審

專利信息
申請?zhí)枺?/td> 201810326887.1 申請日: 2018-04-12
公開(公告)號: CN108460029A 公開(公告)日: 2018-08-28
發(fā)明(設(shè)計)人: 熊德意;許雪瑩 申請(專利權(quán))人: 蘇州大學(xué)
主分類號: G06F17/28 分類號: G06F17/28;G06F17/27
代理公司: 蘇州市中南偉業(yè)知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 32257 代理人: 馮瑞;楊慧林
地址: 215104 江蘇*** 國省代碼: 江蘇;32
權(quán)利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關(guān)鍵詞: 訓(xùn)練語料 機器翻譯 數(shù)據(jù)縮減 神經(jīng) 輪數(shù) 語料 平行 動態(tài)選擇 保留 預(yù)設(shè) 翻譯 返回 保證
【說明書】:

發(fā)明涉及一種面向神經(jīng)機器翻譯的數(shù)據(jù)縮減方法,包括:利用完整的初始語料進(jìn)行第一輪訓(xùn)練;把上一輪平行句對的訓(xùn)練損失選擇保留一部分損失最小的訓(xùn)練語料留到下一輪繼續(xù)訓(xùn)練,其中,下一輪訓(xùn)練語料的大小與上一輪訓(xùn)練語料的大小的比值β∈﹙0,1﹚;判斷已經(jīng)進(jìn)行的訓(xùn)練輪數(shù)是否小于等于預(yù)設(shè)的總的訓(xùn)練輪數(shù),若是,繼續(xù)返回步驟“把上一輪平行句對的訓(xùn)練損失選擇保留一部分損失最小的訓(xùn)練語料留到下一輪繼續(xù)訓(xùn)練,其中,下一輪訓(xùn)練語料的大小與上一輪訓(xùn)練語料的大小的比值β∈﹙0,1﹚”。上述面向神經(jīng)機器翻譯的數(shù)據(jù)縮減方法,根據(jù)現(xiàn)有的NMT的特性,是動態(tài)選擇的,保證NMT在大規(guī)模的語料上訓(xùn)練同時在速度上更快,翻譯質(zhì)量也更好。

技術(shù)領(lǐng)域

本發(fā)明涉及神經(jīng)機器翻譯,特別是涉及面向神經(jīng)機器翻譯的數(shù)據(jù)縮減方法。

背景技術(shù)

近幾年來,機器翻譯一直備受人們的關(guān)注,基于深度學(xué)習(xí)的神經(jīng)機器翻譯(NeuralMachine Translation)是近幾年的熱點,但是使用大規(guī)模的平行語料訓(xùn)練神經(jīng)機器翻譯往往需要花費很長的時間,并且在大語料中,通常會存在數(shù)據(jù)冗余或者質(zhì)量較差的語料。在原來的統(tǒng)計機器翻譯(Statistical Machine Translation)中,是通過減少數(shù)據(jù)冗余的方式來縮小語料大小,從而縮短訓(xùn)練時間,同時能達(dá)到同樣的翻譯質(zhì)量。減少數(shù)據(jù)冗余的方式是選擇一個語料子集,該子集能從某些特性上覆蓋原來的語料,這些特性不是來反映語義相似性的,而是評判句子所攜帶的信息量的,比如n-gram或者單詞。同時,也有通過減少語料中的噪音來減少語料規(guī)模,過濾那些不是互為翻譯的平行句對。

到現(xiàn)在為止,數(shù)據(jù)縮減的方法都是面向SMT的,并且都是靜態(tài)選擇方法,即抽取一個語料子集來訓(xùn)練,還未提出面向NMT的數(shù)據(jù)選擇方法。基于n-gram的方法是選擇一個語料子集,該語料子集中包含原來平行語料中所有不同的n-gram;基于單詞的方法是選擇一個語料子集,該語料子集中包含原來平行語料中所有不同的單詞,并且每個單詞出現(xiàn)的次數(shù)不低于N。這兩種方法都是基于某種特性來挑選語料子集,但是并不適用與NMT,因為在NMT系統(tǒng)中,是根據(jù)訓(xùn)練語料來生成源端與目標(biāo)端的詞表,并且詞表大小是固定的,一般設(shè)置為30000個詞,詞表中的詞一般是挑選出現(xiàn)次數(shù)最多的,我們會用統(tǒng)一的符號“UNK”來代替不在詞表中的單詞。而根據(jù)上面兩種特性挑選語料子集,一方面,會導(dǎo)致語料中的“UNK”比例增大;另一方面,可能常用詞會成為UNK。還有一種SMT的數(shù)據(jù)縮減方法,是通過使用TF-IDF來計算句子的相似性,選擇各不相似的平行句對作為訓(xùn)練子集。但是該方法使用TF-IDF來計算相似度并不準(zhǔn)確。NMT總是需要大規(guī)模的語料訓(xùn)練,在領(lǐng)域適應(yīng)性的應(yīng)用場景中,提出了一種動態(tài)選擇法,在訓(xùn)練NMT的過程中,每次訓(xùn)練完一輪語料,就根據(jù)事先賦予平行句對的權(quán)重動態(tài)地縮小語料規(guī)模。但是該方法并不是面向數(shù)據(jù)縮減提出的,句子的權(quán)重計算也不適用于數(shù)據(jù)縮減。

傳統(tǒng)技術(shù)存在以下技術(shù)問題:

現(xiàn)有的數(shù)據(jù)縮減技術(shù)主要是面向SMT的,但這些方法并不適用于NMT。現(xiàn)有技術(shù)抽取的語料子集中都包含原語料中的所有不同的單詞,但訓(xùn)練子集中并沒有原來那么多的語料來訓(xùn)練這些單詞;在NMT中,源端與目標(biāo)端詞表大小都固定為30000個單詞,而選取的訓(xùn)練子集中的單詞分布與原有的訓(xùn)練語料不同,導(dǎo)致一些有用的單詞成為UNK。基于TF-IDF來挑選訓(xùn)練子集的準(zhǔn)確度不高。而在NMT上提出的動態(tài)選擇法,能夠保證NMT在大規(guī)模語料上訓(xùn)練,這是靜態(tài)選擇法所欠缺的,但現(xiàn)有的動態(tài)選擇法只適用于領(lǐng)域適應(yīng)性場景。

發(fā)明內(nèi)容

基于此,有必要針對上述技術(shù)問題,提供一種根據(jù)現(xiàn)有的NMT的特性,提出了一個動態(tài)選擇的面向神經(jīng)機器翻譯的數(shù)據(jù)縮減方法,保證NMT在大規(guī)模的語料上訓(xùn)練同時在速度上更快,翻譯質(zhì)量也更好。

一種面向神經(jīng)機器翻譯的數(shù)據(jù)縮減方法,應(yīng)用在基于注意力機制且采用encoder-decoder框架的NMT模型,包括:

利用完整的初始語料進(jìn)行第一輪訓(xùn)練;

下載完整專利技術(shù)內(nèi)容需要扣除積分,VIP會員可以免費下載。

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于蘇州大學(xué),未經(jīng)蘇州大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201810326887.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

×

專利文獻(xiàn)下載

說明:

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書;

2、支持發(fā)明專利 、實用新型專利、外觀設(shè)計專利(升級中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖流程工藝圖技術(shù)構(gòu)造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進(jìn)行下載,點擊【登陸】 【注冊】

關(guān)于我們 尋求報道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標(biāo)識 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 羞羞免费视频网站| 亚洲精品久久久久久久久久久久久久| 17c国产精品一区二区| 日本少妇一区二区三区| 欧美在线视频一区二区三区| 中文字幕视频一区二区| 午夜一区二区三区在线观看| 91久久国产露脸精品国产| 国内精品久久久久久久星辰影视| 性生交片免费看片| 国产精品19乱码一区二区三区| 91精品婷婷国产综合久久竹菊| 香港三日三级少妇三级99| 国产一级不卡视频| 国产91精品高清一区二区三区| 欧美资源一区| 久久国产欧美日韩精品| 亚洲精品乱码久久久久久国产主播| 国产精品爽到爆呻吟高潮不挺| 亚洲伊人久久影院| 国内精品国产三级国产99| 中文字幕在线视频一区二区| 亚洲国产精品一区在线| xoxoxo亚洲国产精品| 欧美一区二区三区三州| 在线国产一区二区三区| 欧美系列一区二区| 国产日韩欧美精品一区| 少妇av一区二区三区| 特级免费黄色片| 亚洲乱亚洲乱妇50p| 国产精品国产三级国产专区53| 亚洲一二三四区| 日韩精品人成在线播放| 国产一区二区国产| 日韩av在线中文| 国产精品一区二区麻豆| 免费毛片a| 偷拍久久精品视频| 国产91丝袜在线熟| 国内少妇偷人精品视频免费| 911久久香蕉国产线看观看| 国产精品高潮呻| 美女啪啪网站又黄又免费| 国产精欧美一区二区三区久久久| 国产精品一区一区三区| 自偷自拍亚洲| 亚洲自拍偷拍一区二区三区| 97人人模人人爽视频一区二区| 欧美日韩国产色综合一二三四| 国产美女视频一区二区三区| 久久久精品视频在线| 国产精品免费不卡| 国产视频一区二区三区四区| 国产精品日产欧美久久久久| 麻豆精品国产入口| 久久久中精品2020中文| 国产日产欧美一区二区| 欧美精品八区| 欧美一区二区三区免费视频| 日本一区二区三区四区高清视频| 蜜臀久久精品久久久用户群体| 国产69精品久久久久999天美| 精品国产乱码久久久久久久久| 国产精品一区二区不卡| 久爱视频精品| 欧美系列一区二区| 欧美一区二区三区四区在线观看| 久久综合国产精品| 国产精品对白刺激在线观看| 午夜三级电影院| 久久影院国产精品| 国产69精品久久久久9999不卡免费 | 国产有码aaaae毛片视频| 欧美激情精品久久久久久免费 | 国产一级二级在线| 日韩欧美多p乱免费视频| 亚洲欧美一区二区精品久久久| 草逼视频网站| 亚洲精品乱码久久久久久写真| 狠狠色噜噜狠狠狠888奇米| 国产精品99久久久久久宅男| 草逼视频网站| 欧美精品中文字幕在线观看| 国产精品视频二区三区| 国产精品视频一区二区三| 国精偷拍一区二区三区| 日韩国产精品久久久久久亚洲| 午夜看片网址| 激情久久综合网| 国产农村妇女精品一区二区| 97久久国产亚洲精品超碰热| xxxx18hd护士hd护士| 中文字幕制服狠久久日韩二区| 国产亚洲欧美日韩电影网| 综合色婷婷一区二区亚洲欧美国产| 欧美在线视频一区二区三区| 午夜激情看片| 九九久久国产精品| 欧美激情精品一区| 精品国产区| 精品香蕉一区二区三区| 欧美日韩偷拍一区| 天干天干天干夜夜爽av| 国产玖玖爱精品视频| 国产精品你懂的在线| 亚洲va久久久噜噜噜久久0| 欧美在线观看视频一区二区| 一本久久精品一区二区| 国产精品久久久av久久久| 亚洲欧美v国产一区二区| 国产偷自视频区视频一区二区| 亚洲国产一区二区久久久777| 一区二区三区欧美视频| 夜夜躁人人爽天天天天大学生| 国内视频一区二区三区| 国产欧美一区二区三区在线看| 国产二区三区视频| 天堂av一区二区| 日本一区二区高清| 国产一区二区三区四区五区七| 亚洲欧洲精品一区二区三区不卡| 久久狠狠高潮亚洲精品| 免费精品一区二区三区视频日产| 国产日韩麻豆| 日韩精品中文字幕久久臀| 国产高清在线精品一区二区三区| 91精品久久天干天天天按摩| 久久久久亚洲国产精品| 欧美精品在线一区二区| 国产一级大片| 国产精品高潮呻吟久| 99久久精品国产国产毛片小说| 国产一级一区二区三区| 一区二区三区欧美在线| 久久噜噜少妇网站| 91麻豆精品国产91久久久资源速度| 国产精品久久久久久久久久久久久久不卡| 狠狠色狠狠色很很综合很久久| 国产亚洲精品久久久久秋霞| 日本99精品| 欧美一区二区三区日本| 国产一区网址| 91久久一区二区| 午夜激情免费电影| 国产一区二区在线观看免费| 91热国产| 99国产精品九九视频免费看| aaaaa国产欧美一区二区| 国产精选一区二区| 亚洲精品国产综合| 欧美性xxxxx极品少妇| 午夜精品999| 国产精品一区亚洲二区日本三区| 国模吧一区二区| 国产农村妇女精品一二区| 国产精品v亚洲精品v日韩精品| 国产极品美女高潮无套久久久| 色午夜影院| 亚洲精品久久久久中文字幕欢迎你| 精品99免费视频| 精品国产18久久久久久依依影院| 91精品国产高清一区二区三区| 国产伦理一区| free性欧美hd另类丰满| 欧美日韩卡一卡二| 欧美一区二区三区中文字幕| 中文在线√天堂| 免费久久一级欧美特大黄| 国产韩国精品一区二区三区| 99久国产| 精品a在线| 挺进警察美妇后菊| 波多野结衣女教师电影| 日本一区二区三区中文字幕| 亚洲乱强伦| 亚洲精品久久久久999中文字幕| 国产欧美日韩另类| 日本亚洲国产精品| 国产精自产拍久久久久久蜜| 亚洲精品国产suv| 私人影院av| 国产精品欧美一区二区三区奶水| 国产99久久九九精品免费| 国产福利一区在线观看| 国产91九色在线播放| 日韩欧美国产精品一区| 国产无套精品一区二区| 久久激情网站| 93久久精品日日躁夜夜躁欧美| 国产97在线看| 免费精品一区二区三区视频日产| 强制中出し~大桥未久4| 久久一区欧美| 精品久久小视频| 国产一区二区三区网站| 日韩精品免费一区| 少妇精品久久久久www蜜月| 狠狠色狠狠色合久久伊人| 色就是色欧美亚洲| 扒丝袜网www午夜一区二区三区 | 国产一区二| 精品国产免费一区二区三区| 欧美国产在线看| 日韩精品免费一区二区在线观看| 国产精品伦一区二区三区视频| 国产伦理久久精品久久久久| 亚洲精品久久久久不卡激情文学| 色乱码一区二区三在线看| 一区二区三区在线观看国产| 精品中文久久| 性欧美一区二区三区| 国产91在线拍偷自揄拍| 日本边做饭边被躁bd在线看| 欧美精品一区二区久久| 日本一二三区视频在线| 99精品国产免费久久| 国产中文字幕91| 午夜爽爽爽男女免费观看| 激情久久综合网| 国产一区二区三区中文字幕| 国久久久久久| 少妇高潮一区二区三区99小说| 在线电影一区二区| 午夜码电影| 狠狠干一区| 国产在线欧美在线| 久久久99精品国产一区二区三区| 欧美日韩精品不卡一区二区三区| 国产精品一区二区在线看| 99精品偷拍视频一区二区三区 | 亚洲精品国产精品国自| 正在播放国产一区二区| 国产一区二区伦理| 97香蕉久久国产超碰青草软件 | 亚洲福利视频一区| 国产在线干| 91久久免费| 国产乱xxxxx国语对白| 丝袜诱惑一区二区三区| 日韩av免费网站| 国产高清精品一区| 国产精品白浆视频| 久久精品99国产精品亚洲最刺激| 欧美精品一区二区三区在线四季| 国产不卡一区在线|