[發明專利]一種基于人工智能的多語言翻譯方法及系統在審
| 申請號: | 202110268132.2 | 申請日: | 2021-03-11 |
| 公開(公告)號: | CN112949325A | 公開(公告)日: | 2021-06-11 |
| 發明(設計)人: | 杜金林 | 申請(專利權)人: | 上海佑譯信息科技有限公司 |
| 主分類號: | G06F40/58 | 分類號: | G06F40/58 |
| 代理公司: | 上海大為知衛知識產權代理事務所(普通合伙) 31390 | 代理人: | 何銀南 |
| 地址: | 200000 上海市*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 人工智能 語言 翻譯 方法 系統 | ||
本發明屬于多語音翻譯技術領域,公開了一種基于人工智能的多語言翻譯方法,包括以下步驟:獲取待翻譯的第一語言文本,將所述第一語言文本翻譯為第二語言文本;建立第一語言文本與第二語言文本的映射關系模型,將所述映射關系模型存儲于本地并將所述映射關系模型反饋至云端服務器;判斷在第一預設時間內所獲取的第一語言文本是否達到第一預設次數;本發明將映射關系模型存儲于本地以及反饋至云端服務器,當在第一預設時間內所獲取的第一語言文本未達到第一預設次數時,刪除存儲于本體的映射關系模型,保留反饋至云端服務器的映射關系模型,節省了內存,下次翻譯可從云端加載,節省了第三方翻譯的費用。
技術領域
本發明屬于多語言翻譯技術領域,具體涉及一種基于人工智能的多語言翻譯方法及系統。
背景技術
機器翻譯是指利用計算機程序將文字從一種自然語言(源語言)翻譯成另一種自然語言(目標語言)的技術。目前,基于語料庫的機器翻譯技術代表著該領域的主流技術趨勢,諸如統計機器翻譯(Statistical Machine Translation,SMT)及神經網絡機器翻譯(Neural Machine Translation,NMT),均依賴于含有大量訓練數據的語料庫來進行對翻譯模型的訓練。雙語語料是這類語料庫中的一種語料數據,無論對于SMT,還是NMT,絕大多數機器翻譯技術均是基于雙語語料進行模型訓練。然而,由于雙語語料僅是特定語言對(例如中-英、英-俄)的互譯語料,因此訓練得到的機器翻譯模型也僅針對該特定語言對的翻譯任務,對于第三種語言則無法做出應有的翻譯。
另一方面,一直以來,機器翻譯領域中翻譯模型所需的訓練語料屬于稀缺資源。舉例來講,目前認為,高質量的雙語互譯語料中,中-英雙語互譯句對有2億條,英-俄雙語互譯句對有1億條,而中-俄的雙語互譯句對僅有200萬條。也就是說,與中-英、英-俄的雙語語料庫數據量相比,中-俄雙語語料庫的數據量明顯偏少,屬于稀缺資源語言對,以至于針對中-俄雙語的機器翻譯模型的訓練無法達到預期,翻譯質量堪憂。
對于如何實現稀缺資源語言對的源語言與目標語言(例如中-俄)之間的翻譯,目前已知的處理方式有兩種:第一種方式是尋找一種橋接語言(例如英文),對從源語言到橋接語言(例如中-英)的翻譯模型和從橋接語言到目標語言(例如英-俄)的翻譯模型,分別獨立地進行訓練,之后再進行兩次翻譯(源語言翻譯為橋接語言、橋接語言翻譯為目標語言),通過橋接的方式,最終完成源語言到目標語言的翻譯;第二種方式是基于傳統的神經機器翻譯模型,強行將所有的語言對語料(例如中-英、英-俄以及中-俄)進行共同訓練,最終得到一個涉及多語言(例如中文、英文和俄文)的機器翻譯模型。
目前現有的翻譯處理方式在翻譯速度較慢,而翻譯速度較塊的神經機器翻譯模型占存較大,翻譯速度和占存之間不能平衡。
發明內容
本發明的目的在于提供一種基于人工智能的多語言翻譯方法及系統,以解決現有的翻譯速度較慢,而翻譯速度較塊的神經機器翻譯模型占存較大,使得翻譯速度和占存之間不能平衡的問題。
為實現上述目的,本發明提供如下技術方案:一種基于人工智能的多語言翻譯方法,包括以下步驟:
獲取待翻譯的第一語言文本,將所述第一語言文本翻譯為第二語言文本;
建立第一語言文本與第二語言文本的映射關系模型,將所述映射關系模型存儲于本地并將所述映射關系模型反饋至云端服務器;
判斷在第一預設時間內所獲取的第一語言文本是否達到第一預設次數;
當在第一預設時間內所獲取的第一語言文本未達到第一預設次數時,刪除存儲于本體的所述映射關系模型,保留反饋至云端服務器的映射關系模型。
作為本發明一種基于人工智能的多語言翻譯方法優選地,在所述的判斷在第一預設時間內所獲取的第一語言文本是否達到第一預設次數之后包括步驟:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海佑譯信息科技有限公司,未經上海佑譯信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110268132.2/2.html,轉載請聲明來源鉆瓜專利網。





