[發明專利]機器學習人工智能翻譯數據庫的更新方法有效
| 申請號: | 201810873984.2 | 申請日: | 2018-08-02 |
| 公開(公告)號: | CN109241539B | 公開(公告)日: | 2023-09-08 |
| 發明(設計)人: | 王大江 | 申請(專利權)人: | 愛云保(上海)科技有限公司 |
| 主分類號: | G06F40/58 | 分類號: | G06F40/58;G06F40/242;G06F40/30;G06F16/33;G06F16/36;G06F16/23;G10L15/00;G10L15/06;G10L15/26 |
| 代理公司: | 成都貞元會專知識產權代理有限公司 51390 | 代理人: | 韓敏 |
| 地址: | 200050 上海市*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 機器 學習 人工智能 翻譯 數據庫 更新 方法 | ||
為了進一步提高在線翻譯時的效率和準確性,從而提高翻譯數據庫的更新效率,本發明提供了一種機器學習人工智能翻譯數據庫的更新方法,包括(10)以機器學習方式建立詞語庫;(20)建立人工智能語音預測模型;(30)將待翻譯的語音轉換成文字;(40)根據所述詞語庫和語音預測模型,確定譯文文字。本發明能夠通過機器學習得到的大數據外文?中文對照詞典,基于6階深度概率分析方法進行語義和語境的匹配,從而相比現有技術的做法降低了超過40%以上的運算量,在確保翻譯準確性的同時提高了翻譯效率和更新效率。
技術領域
本發明涉及語音控制技術領域,更具體地,涉及一種機器學習人工智能翻譯數據庫的更新方法。
背景技術
隨著科學技術的發展和經濟全球化,無論是在日常生活中還是學術領域溝通上,在線翻譯交流已經存在越來越多的需求。盡管已經存在同聲傳譯、便攜式機器翻譯設備等應運而生,但在涉及專業領域的會議或課堂等的使用場景里,傳統機器翻譯設備的準確度以及同聲傳譯人員的效率是令人堪憂的。尤其是當某方語速較快時,機器翻譯將難以勝任,而同聲傳譯人員則需要使用重新確認的方式復述沒有跟上的語言,從而給一些使用場景帶來不順暢的體驗。
為了同時滿足在線翻譯的效率和準確性的提高需求,申請號為CN201710203439.8的中國發明專利申請公開了一種多語言智能預處理實時統計機器翻譯系統,包括:接收模塊、預處理模塊、機器翻譯模塊和后處理模塊。所述接收模塊包括文本語言接收模塊和語音識別結果接收模塊;所述預處理模塊包括文本預處理模塊和語音識別結果預處理模塊;機器翻譯模塊,所述機器翻譯模塊用于學習短語對短語的翻譯,并對經過預處理模塊處理的短語找出對應的翻譯短語,以及把短語連接成完整的句子;后處理模塊,所述后處理模塊用于對翻譯結果做單詞標點規范化、大小寫規范化和格式規范化處理,使其更加接近目標語言的表達習慣,并作為最終結果輸出。然而,這種系統對于現有技術的上述弊端解決力度有限。
發明內容
為了進一步提高在線翻譯時的效率和準確性,從而提高翻譯數據庫的更新效率,本發明提供了一種機器學習人工智能翻譯數據庫的更新方法,包括:
(10)以機器學習方式建立詞語庫;
(20)建立人工智能語音預測模型;
(30)將待翻譯的語音轉換成文字;
(40)根據所述詞語庫和語音預測模型,確定譯文文字;
(50)對譯文文字進行校正,并根據校正結果更新所述詞語庫。
進一步地,所述步驟(10)包括:利用機器學習方式,根據詞典建立外文詞語和與該外文詞語對應的中文含義的詞語之間的第一關聯,其中中文詞語的譯文為多個時以詞典中的第一順序位置標識的中文譯文詞語為主要中文譯文詞語而之后順序位置的中文譯文詞語作為次要中文譯文詞語。
進一步地,所述步驟(20)包括:
(201)根據外文文章進行切詞得到外文詞語并根據該外文文章的中文譯文詞語,建立外文詞語和中文譯文詞語以及該中文譯文詞語之后接續的二級詞語的第二關聯;
(202)將第一關聯和第二關聯進行索引;
進一步地,所述步驟(201)包括:根據外文文章以無監督學習方式進行機器學習。
進一步地,所述步驟(201)包括:采用隨機梯度下降法對外文文章及其譯文進行機器學習。
進一步地,所述步驟(202)包括:
以第一關聯為主鍵,從第二關聯中出現的與第一關聯相關的信息進行索引。
進一步地,所述以第一關聯為主鍵,從第二關聯中出現的與第一關聯相關的信息進行索引包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于愛云保(上海)科技有限公司,未經愛云保(上海)科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810873984.2/2.html,轉載請聲明來源鉆瓜專利網。





