[發明專利]基于逆向文本共識的多翻引擎協作語音翻譯系統與方法在審
| 申請號: | 202110054103.6 | 申請日: | 2021-01-19 |
| 公開(公告)號: | CN112818707A | 公開(公告)日: | 2021-05-18 |
| 發明(設計)人: | 何征宇 | 申請(專利權)人: | 傳神語聯網網絡科技股份有限公司 |
| 主分類號: | G06F40/56 | 分類號: | G06F40/56;G06F40/58 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 430073 湖北省武漢*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 逆向 文本 共識 引擎 協作 語音 翻譯 系統 方法 | ||
本發明提出基于逆向文本共識的多翻引擎協作語音翻譯系統與方法。所述系統包括:語音輸入子系統:用于輸入待譯語音;第一語音翻譯子系統:用于對待譯語音進行翻譯輸出第一語音翻譯結果;第二文本翻譯子系統、共識判斷子系統以及輸出子系統;第二文本翻譯子系統包括多個文本翻譯引擎;將第一語音翻譯子系統輸出的每個第一語音翻譯結果作為第二文本翻譯子系統的多個文本翻譯引擎的輸入,第二文本翻譯子系統輸出多個文本翻譯結果;共識判斷子系統基于所述多個文本翻譯結果,進行翻譯結果共識判斷;所述輸出子系統基于翻譯結果共識判斷輸出對應于所述待譯語音的翻譯記錄文件。本發明還提出基于上述系統實現的語音翻譯方法。
技術領域
本發明屬于語音智能翻譯技術領域,尤其涉及一種基于逆向文本共識的多翻引擎協作語音翻譯系統與方法。
背景技術
隨著人類社會、經濟和文化的日益全球化,持不同母語的人在旅游、會議、商貿、體育等許多場合中的交流變得越來越頻繁,語言上的障礙也愈見明顯。于是,人們迫切希望計算機能夠具有更高的智能以充當克服人類語言障礙的中間角色,實現人與人之間的自由交流。這種由計算機系統實現的從一種自然語言的語音到另一種自然語言語音的翻譯就是我們通常所說的語音翻譯(Speech-to-Speech Translation)。由于人們之間的日常交流通常是以自然語語形式進行的,研究自然口語的自動翻譯往往具有更廣闊的應用前景,目前國際上開展語音翻譯技術的研究一般也都是基于自然口語的,因此,語音翻譯又常被稱為口語自動翻譯(Automatic Spoken Language Translation,簡寫為SLT)。
目前口語自動翻譯的研究和應用有兩個典型應用場景:一是不同語言使用者之間面對面的日常口語溝通交流;二是會議場景下講者面向廣大聽眾的演講交流會議場景下。由于會議具有領域專業性,其涉及的大量專業術語和行業相關的語言表達,給機器翻譯帶來較大挑戰。
對此,中國發明專利申請CN202011016786.8針對實時翻譯場景,聚焦于由語音識別引擎提供的連續語音的轉寫文本,即先辨識出待處理的當前文本其中是否混雜著多種語種字詞,當判定為混語種文本后進而結合語句之間的時間間隔以及在先語句的語種,即處理當前文本之前所使用的翻譯方向,得到切換閾值,最后根據該切換閾值以及當前待處理文本中的不同語種字詞的占比,決策是否需要將處理當前文本之前所使用的翻譯方向進行切換。
重要的高端會議(例如多國首腦會議、多用戶高端會議)通常需要準確記錄與會者的實時發言。但是由于會議通常需要保持實時性,避免較長延遲,現有的系統都只能直接保存所有與會者發言記錄,這顯然增大了數據存儲量與傳輸量,尤其是在遠程會議中會帶來較大的傳輸成本。如果不記錄所有發言,則需要人工對不同語種的翻譯結果進行校對,又降低了工作效率,且需要增加人工成本。
因此,如何有效的針對多語種多用戶的遠程會議生成有效的會議記錄,并自動化的識別出可能存在的翻譯爭議,成為亟待解決的技術問題。
發明內容
為解決上述技術問題,本發明提出一種基于逆向文本共識的多翻引擎協作語音翻譯系統與方法。所述系統包括:語音輸入子系統:用于輸入待譯語音;第一語音翻譯子系統:用于對待譯語音進行翻譯輸出第一語音翻譯結果;第二文本翻譯子系統、共識判斷子系統以及輸出子系統;第二文本翻譯子系統包括多個文本翻譯引擎;將第一語音翻譯子系統輸出的每個第一語音翻譯結果作為第二文本翻譯子系統的多個文本翻譯引擎的輸入,第二文本翻譯子系統輸出多個文本翻譯結果;共識判斷子系統基于所述多個文本翻譯結果,進行翻譯結果共識判斷;所述輸出子系統基于翻譯結果共識判斷輸出對應于所述待譯語音的翻譯記錄文件。
本發明還提出基于上述系統實現的語音翻譯方法。
具體來說,在本發明的第一個方面,提供一種基于逆向文本共識的多翻引擎協作語音翻譯系統,所述系統包括:
語音輸入子系統:所述語音輸入子系統用于輸入待譯語音;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于傳神語聯網網絡科技股份有限公司,未經傳神語聯網網絡科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110054103.6/2.html,轉載請聲明來源鉆瓜專利網。





