[發明專利]機器翻譯模型的自動訓練方法、平臺、電子設備、及存儲介質有效
| 申請號: | 202010170720.8 | 申請日: | 2020-03-12 |
| 公開(公告)號: | CN111310484B | 公開(公告)日: | 2021-07-06 |
| 發明(設計)人: | 趙程綺;李磊;周浩;王明軒;潘驍 | 申請(專利權)人: | 北京字節跳動網絡技術有限公司 |
| 主分類號: | G06F40/58 | 分類號: | G06F40/58;G06N20/00 |
| 代理公司: | 北京遠智匯知識產權代理有限公司 11659 | 代理人: | 范坤坤 |
| 地址: | 100041 北京市石景山區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 機器翻譯 模型 自動 訓練 方法 平臺 電子設備 存儲 介質 | ||
本公開實施例公開了一種機器翻譯模型的自動訓練方法、平臺、電子設備、及存儲介質,方法包括:將至少一個翻譯環節進行可視化展示;獲取用戶輸入的針對待訓練目標模型的訓練指令;根據所述訓練指令確定至少一個待執行翻譯環節和配置信息,獲取所述至少一個待執行翻譯環節的腳本文件,并將所獲取的腳本文件根據所述配置信息進行參數配置后關聯在一起;運行關聯后的腳本文件,以訓練所述目標模型。本公開實施例提供的自動機器翻譯訓練方法,能實現機器翻譯過程的可視化控制和便捷化控制。
技術領域
本公開實施例涉及自然語言處理技術領域,具體涉及一種機器翻譯模型的自動訓練方法、平臺、電子設備、及存儲介質。
背景技術
機器翻譯模型的訓練過程至少需要對樣本數據經過數據清洗(例如臟字符剔除,標點規范化,臟數據剔除等)、數據預處理(如中文分詞、日文分詞等)、模型訓練、機器自動評估(效果)、人工評估、模型上線等。
通常,每個翻譯環節都需要很多人工設置,要求模型訓練人員的有較高的專業水平,另外,訓練過程中各環節一般獨立運行,需要模型訓練人員執行的操作過多,不能順暢地一鍵操作。
發明內容
有鑒于此,本公開實施例提供一種機器翻譯模型的自動訓練方法、平臺、電子設備、及存儲介質,以實現機器翻譯過程的可視化控制和便捷化控制。
本公開實施例的其他特性和優點將通過下面的詳細描述變得顯然,或部分地通過本公開實施例的實踐而習得。
在本公開的第一方面,本公開實施例提供了一種機器翻譯模型的自動訓練方法,包括:
將至少一個翻譯環節進行可視化展示;
獲取用戶輸入的針對待訓練目標模型的訓練指令;
根據所述訓練指令確定至少一個待執行翻譯環節和配置信息,獲取所述至少一個待執行翻譯環節的腳本文件,并將所獲取的腳本文件根據所述配置信息進行參數配置后關聯在一起;
運行關聯后的腳本文件,以訓練所述目標模型。
在本公開的第二方面,本公開實施例還提供了一種機器翻譯模型的自動訓練平臺,包括:
展示模塊,用于將至少一個翻譯環節進行可視化展示;
訓練指令獲取模塊,用于獲取用戶輸入的針對待訓練目標模型的訓練指令;
環節確定與腳本關聯模塊,用于根據所述訓練指令確定至少一個待執行翻譯環節和配置信息,獲取所述至少一個待執行翻譯環節的腳本文件,并將所獲取的腳本文件根據所述配置信息進行參數配置后關聯在一起;
目標模型訓練模塊,用于運行關聯后的腳本文件,以訓練所述目標模型。
在本公開的第三方面,提供了一種電子設備。該電子設備包括:處理器;以及存儲器,用于存儲可執行指令,所述可執行指令在被所述處理器執行時使得所述電子設備執行第一方面中的方法。
在本公開的第四方面,提供了一種計算機可讀存儲介質,其上存儲有計算機程序,該計算機程序被處理器執行時實現第一方面中的方法。
本公開實施例通過將至少一個翻譯環節進行可視化展示,獲取用戶輸入的針對待訓練目標模型的訓練指令,以據此確定至少一個待執行翻譯環節和配置信息,獲取所述至少一個待執行翻譯環節的腳本文件,并將所獲取的腳本文件根據所述配置信息進行參數配置后關聯在一起運行,以訓練目標模型,能實現機器翻譯過程的可視化控制和便捷化控制。
附圖說明
為了更清楚地說明本公開實施例中的技術方案,下面將對本公開實施例描述中所需要使用的附圖作簡單的介紹,顯而易見地,下面描述中的附圖僅僅是本公開實施例中的一部分實施例,對于本領域普通技術人員來講,在不付出創造性勞動的前提下,還可以根據本公開實施例的內容和這些附圖獲得其他的附圖。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京字節跳動網絡技術有限公司,未經北京字節跳動網絡技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010170720.8/2.html,轉載請聲明來源鉆瓜專利網。





