[發(fā)明專利]面向神經(jīng)機(jī)器翻譯的數(shù)據(jù)縮減方法在審
| 申請(qǐng)?zhí)枺?/td> | 201810326887.1 | 申請(qǐng)日: | 2018-04-12 |
| 公開(公告)號(hào): | CN108460029A | 公開(公告)日: | 2018-08-28 |
| 發(fā)明(設(shè)計(jì))人: | 熊德意;許雪瑩 | 申請(qǐng)(專利權(quán))人: | 蘇州大學(xué) |
| 主分類號(hào): | G06F17/28 | 分類號(hào): | G06F17/28;G06F17/27 |
| 代理公司: | 蘇州市中南偉業(yè)知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 32257 | 代理人: | 馮瑞;楊慧林 |
| 地址: | 215104 江蘇*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 訓(xùn)練語料 機(jī)器翻譯 數(shù)據(jù)縮減 神經(jīng) 輪數(shù) 語料 平行 動(dòng)態(tài)選擇 保留 預(yù)設(shè) 翻譯 返回 保證 | ||
1.一種面向神經(jīng)機(jī)器翻譯的數(shù)據(jù)縮減方法,應(yīng)用在基于注意力機(jī)制且采用encoder-decoder框架的NMT模型,其特征在于,包括:
利用所述完整的初始語料進(jìn)行第一輪訓(xùn)練;
把上一輪平行句對(duì)的訓(xùn)練損失選擇保留一部分損失最小的訓(xùn)練語料留到下一輪繼續(xù)訓(xùn)練,其中,下一輪訓(xùn)練語料的大小與上一輪訓(xùn)練語料的大小的比值β∈﹙0,1﹚;
判斷已經(jīng)進(jìn)行的訓(xùn)練輪數(shù)是否小于等于預(yù)設(shè)的總的訓(xùn)練輪數(shù),若是,繼續(xù)返回步驟“把上一輪平行句對(duì)的訓(xùn)練損失選擇保留一部分損失最小的訓(xùn)練語料留到下一輪繼續(xù)訓(xùn)練,其中,下一輪訓(xùn)練語料的大小與上一輪訓(xùn)練語料的大小的比值β∈﹙0,1﹚;”。
2.根據(jù)權(quán)利要求1所述的面向神經(jīng)機(jī)器翻譯的數(shù)據(jù)縮減方法,其特征在于,β∈[0.6,0.8]。
3.根據(jù)權(quán)利要求1所述的面向神經(jīng)機(jī)器翻譯的數(shù)據(jù)縮減方法,其特征在于,所述預(yù)設(shè)的總的訓(xùn)練輪數(shù)數(shù)量為10。
4.一種計(jì)算機(jī)設(shè)備,包括存儲(chǔ)器、處理器及存儲(chǔ)在存儲(chǔ)器上并可在處理器上運(yùn)行的計(jì)算機(jī)程序,其特征在于,所述處理器執(zhí)行所述程序時(shí)實(shí)現(xiàn)權(quán)利要求1-3中任意一項(xiàng)所述方法的步驟。
5.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,其特征在于,該程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)權(quán)利要求1-3任意一項(xiàng)所述方法的步驟。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于蘇州大學(xué),未經(jīng)蘇州大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810326887.1/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 一種基于語義及語法結(jié)構(gòu)的語句分析方法及系統(tǒng)
- 分詞模型訓(xùn)練方法和裝置、及存儲(chǔ)介質(zhì)
- 模型的自訓(xùn)練方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 訓(xùn)練語料庫細(xì)化和增量更新
- 同義語料生成方法、裝置、計(jì)算機(jī)系統(tǒng)及可讀存儲(chǔ)介質(zhì)
- 多語言語義表示模型的訓(xùn)練方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 意圖識(shí)別模型訓(xùn)練方法、意圖識(shí)別方法、裝置及設(shè)備
- 意圖識(shí)別模型的訓(xùn)練語料生成方法及其相關(guān)設(shè)備
- 翻譯模型訓(xùn)練方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 基于預(yù)訓(xùn)練模型的機(jī)器翻譯方法及系統(tǒng)
- 一種用于提高機(jī)器翻譯質(zhì)量的裝置和方法
- 機(jī)器翻譯方法和裝置
- 一種ERP術(shù)語機(jī)器翻譯方法
- 機(jī)器翻譯引擎推薦方法及裝置
- 神經(jīng)機(jī)器翻譯模型的訓(xùn)練方法、裝置及存儲(chǔ)介質(zhì)
- 基于機(jī)器翻譯引擎的翻譯方法及裝置
- 一種基于篇章的機(jī)器翻譯引擎測評(píng)優(yōu)選方法及系統(tǒng)
- 機(jī)器翻譯引擎服務(wù)恢復(fù)方法及裝置
- 一種基于預(yù)訓(xùn)練的稀缺資源神經(jīng)機(jī)器翻譯訓(xùn)練方法
- 基于混合策略的移動(dòng)設(shè)備機(jī)器翻譯系統(tǒng)
- 圖像處理裝置、圖像攝像系統(tǒng)和圖像顯示系統(tǒng)
- 圖像處理設(shè)備、顯示設(shè)備、圖像處理方法以及圖像處理程序
- 表格相關(guān)數(shù)據(jù)縮減
- 用于捕獲廣播信號(hào)的廣播接收設(shè)備及其方法
- 坐標(biāo)測量系統(tǒng)數(shù)據(jù)縮減
- 紋理磚壓縮及解壓縮方法以及使用該方法的裝置
- 用于縮減數(shù)據(jù)集的數(shù)據(jù)縮減
- 數(shù)據(jù)縮減的方法、裝置、計(jì)算設(shè)備和存儲(chǔ)介質(zhì)
- 一種數(shù)據(jù)存儲(chǔ)方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 存儲(chǔ)系統(tǒng)數(shù)據(jù)縮減業(yè)務(wù)日志管理方法及相關(guān)組件
- 用于治療支氣管樹的系統(tǒng)、組件和方法
- 一種頸部神經(jīng)信號(hào)記錄方法
- 用于在激活褐色脂肪組織時(shí)抑制神經(jīng)的方法和裝置
- 一種神經(jīng)元硬件裝置及用這種裝置模擬脈沖神經(jīng)網(wǎng)絡(luò)的方法
- 神經(jīng)移植物及應(yīng)用其的神經(jīng)移植物系統(tǒng)
- 一種神經(jīng)疏通緩解裝置
- 神經(jīng)移植物及應(yīng)用其的神經(jīng)移植物系統(tǒng)
- 一種模擬神經(jīng)網(wǎng)芯片的設(shè)計(jì)方法及模擬神經(jīng)網(wǎng)芯片
- 神經(jīng)網(wǎng)絡(luò)的剪枝方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一套無人機(jī)神經(jīng)網(wǎng)絡(luò)控制用的人工神經(jīng)元模型





