[發明專利]機器翻譯模型的訓練方法和機器翻譯方法在審
| 申請號: | 202111475509.8 | 申請日: | 2021-12-06 |
| 公開(公告)號: | CN114372480A | 公開(公告)日: | 2022-04-19 |
| 發明(設計)人: | 林歡;姚亮;楊寶嵩;張海波;駱衛華 | 申請(專利權)人: | 阿里巴巴達摩院(杭州)科技有限公司 |
| 主分類號: | G06F40/58 | 分類號: | G06F40/58;G06F40/216;G06K9/62 |
| 代理公司: | 北京成創同維知識產權代理有限公司 11449 | 代理人: | 劉靜 |
| 地址: | 311121 浙江省杭州市余杭*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 機器翻譯 模型 訓練 方法 | ||
本公開提供了一種機器翻譯模型的訓練方法和訓練裝置。該訓練方法包括:獲得特定用戶的待翻譯文本和待翻譯文本的期望譯文;獲得待翻譯文本的第一編碼表達,以及獲得用于表征特定用戶的語言特征的第二編碼表達;根據第一編碼表達和第二編碼表達,獲得輸入給機器翻譯模型的第三編碼表達,以及待翻譯文本的翻譯結果;根據待翻譯文本的翻譯結果與待翻譯文本的期望譯文計算損失值;如果損失值大于或等于預設閾值,則根據損失值調整機器翻譯模型的權重參數;如果損失值小于預設閾值,則停止訓練方法。該方法中采用表征特定用戶的語言特征第二編碼表達調整輸入給機器翻譯模型的編碼表達,以能夠提供個性化的翻譯結果。
技術領域
本公開涉及計算機技術領域,更具體而言,涉及一種機器翻譯模型的訓練方法和機器翻譯方法。
背景技術
機器翻譯是利用計算機程序將一種自然語言(源語言)轉換為另一種自然語言(目標語言)。目前機器翻譯的實施很多采用基于神經網絡技術建模的機器翻譯模型實現。但隨著機器翻譯的廣泛應用,研發人員發現,即使是同一語義,不同用戶也有不同文本表達。雖然目前改進的機器翻譯模型能夠從籍貫、職業、男女等維度控制翻譯結果,但是,這種方式還不是真正意義上的個性化翻譯,其本質上是基于群體特征去控制翻譯結果,并沒有達到基于單一個體的個性化語言特征提供翻譯結果的目的。
發明內容
有鑒于此,本公開旨在提供一種機器翻譯模型的訓練方法和實施該機器翻譯模型的方法,實施該機器翻譯模型能夠達到基于個體的個性化語言特征提供翻譯結果的目的。
根據本公開的第一方面,提供一種機器翻譯模型的訓練方法,包括:
獲得特定用戶的待翻譯文本和所述待翻譯文本的期望譯文;
獲得所述待翻譯文本的第一編碼表達,以及,
獲得用于表征所述特定用戶的語言特征的第二編碼表達;
根據所述第一編碼表達和所述第二編碼表達,獲得輸入給所述機器翻譯模型的第三編碼表達,以及所述待翻譯文本的翻譯結果;
根據所述待翻譯文本的翻譯結果與所述待翻譯文本的期望譯文計算損失值;
如果所述損失值大于或等于預設閾值,則根據所述損失值調整所述機器翻譯模型的權重參數;
如果所述損失值小于預設閾值,則停止所述訓練方法。
在一些實施例中,所述獲得用于表征所述特定用戶的語言特征的第二編碼表達包括:
判斷所述特定用戶的歷史輸入是否存在;
基于所述特定用戶的歷史輸入提取關鍵詞,并據此獲得所述第二編碼表達。
在一些實施例中,所述基于所述特定用戶的歷史輸入提取關鍵詞,并據此獲得所述第二編碼表達包括:
基于所述待翻譯文本與所述特定用戶的歷史輸入獲得上下文關鍵詞;
基于所述待翻譯文本與所有用戶的歷史輸入獲得主題關鍵詞;
基于所述上下文關鍵詞和所述主題關鍵詞分別求取對應的編碼表達;以及
根據所述上下文關鍵詞和所述主題關鍵詞分別對應的編碼表達通過權重求和計算得到所述第二編碼表達,其中,所述權重求和計算中的權重為可學習的參數矩陣。。
在一些實施例中,所述根據所述上下文關鍵詞和所述主題關鍵詞分別對應的編碼表達通過權重求和計算得到所述第二編碼表達包括:
將所述上下文關鍵詞和所述主題關鍵詞分別對應的編碼表達分別與一參數矩陣進行矩陣相乘再求和計算,并將計算結果代入給一激活函數,以得到小于1的第一數值;
將所述第一數值與所述主題關鍵詞對應的編碼表達相乘,得到第一乘積;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于阿里巴巴達摩院(杭州)科技有限公司,未經阿里巴巴達摩院(杭州)科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111475509.8/2.html,轉載請聲明來源鉆瓜專利網。





