[發(fā)明專利]一種數(shù)字視頻字幕自動翻譯方法無效
| 申請?zhí)枺?/td> | 200610087132.8 | 申請日: | 2006-06-13 |
| 公開(公告)號: | CN101090461A | 公開(公告)日: | 2007-12-19 |
| 發(fā)明(設(shè)計(jì))人: | 錢躍良;熊德意;劉群 | 申請(專利權(quán))人: | 中國科學(xué)院計(jì)算技術(shù)研究所 |
| 主分類號: | H04N5/278 | 分類號: | H04N5/278 |
| 代理公司: | 北京泛華偉業(yè)知識產(chǎn)權(quán)代理有限公司 | 代理人: | 高存秀 |
| 地址: | 100080北京*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 數(shù)字視頻 字幕 自動 翻譯 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及字幕的自動翻譯方法,特別涉及一種數(shù)字視頻中字幕的自動翻譯方法。
背景技術(shù)
隨著計(jì)算機(jī)、家庭影院的普及,以及大量的電影采用數(shù)字媒體方式制作、發(fā)布,人們可以快捷、大范圍地接觸來自不同國家、不同地區(qū)、不同語言的電影。但是隨之而來的一個主要問題便是電影觀看者的語言理解問題。一般而言,對電影的理解大部分來自于電影中人物的對話或獨(dú)白,剩下一小部分才是來自于畫面,音樂等非語言因素。因此觀看者若在語言上有障礙,則基本上不會看懂電影。這對于電影制作方來說,意味著失去了大量潛在的觀眾;而對于觀看者來說,則失去了欣賞大量優(yōu)秀電影的機(jī)會。
解決這個問題的傳統(tǒng)做法有三種。第一,制作方為電影添加不同語言的字幕,但是由于制作成本的原因,制作方不可能為每一種語言添加字幕。對于那些非英語電影,一般最多也是添加額外的英語字幕,但問題是并不是所有的非英語觀眾都可以從字面上理解英語。第二種做法則是電影引進(jìn)方對電影進(jìn)行配譯,顯然這種做法成本更加高昂,同時也會造成電影在不同地區(qū)發(fā)行的時間差問題。但最主要的問題是,這種做法不能提供大量的配譯的電影。第三種做法則可以看作是前兩種方法的結(jié)合,即由某一語言的電影愛好者自發(fā)組織起來給外語電影配上翻譯好的字幕,這種方法由于發(fā)揮了廣大愛好者的參與,因此在數(shù)量上基本上可以保證足額,在時間上基本上可以保證及時。但是這種方法也存在以下一些問題:1)翻譯的字幕質(zhì)量良莠不齊;2)字幕和聲音不能很好對應(yīng),這是由于字幕配譯本身也是一項(xiàng)技術(shù)性強(qiáng)的工作,愛好者由于自己的技術(shù)原因或是操作上的疏忽往往導(dǎo)致上面的問題;3)存在版權(quán)糾紛問題;4)不能用于像數(shù)字衛(wèi)星接收機(jī)和DVD機(jī)這種實(shí)時播放系統(tǒng)。
為了克服傳統(tǒng)做法所存在的上述問題,本領(lǐng)域的技術(shù)人員提出了一種字幕翻譯引擎,在申請?zhí)枮?00410038308.1的中國專利申請中對該字幕翻譯引擎進(jìn)行了說明。所述的字幕翻譯引擎用于將來自視頻源的字幕內(nèi)容翻譯成另一種語言,其工作流程主要包含以下步驟:
1、從視頻源中提取第一種語言表示的字幕;
2、查詢語言詞典,將用第一種語言表示的字幕內(nèi)容的文字翻譯為相同含義的第二種語言;
3、將翻譯后的字幕輸出。
在將字幕從第一種語言翻譯為第二種語言的過程中,在短語對短語的基礎(chǔ)上簡單地通過查詢詞典得到譯文,在查詢過程中,如果用第一種語言表示的短語在詞典中不能得到第二種語言同義詞的確定匹配,則對短語進(jìn)行單詞對單詞的翻譯。
在該申請中存在以下問題:
a、在實(shí)際應(yīng)用中,一個詞有多個對應(yīng)的翻譯,或者一個短語有多個對應(yīng)的翻譯,在該申請中沒有說明如何從多種翻譯中選擇最為合適的譯文;
b、一個句子中通常有多種短語切分結(jié)果存在,例如,一個句子可能是“短語a+短語b”,也有可能是“短語c+短語d”,其中短語c可能是短語a的全部加短語b前一部分,短語d是短語b剩下的部分。在該申請中沒有說明是如何實(shí)現(xiàn)對句子短語的劃分的。
對于上述問題,本領(lǐng)域的技術(shù)人員通常采用以下方法解決。
1、若一個詞或短語存在多個翻譯,那么選擇在詞典中排在最前的翻譯;
2、在對句子中的短語進(jìn)行劃分時,從左至右,每次選擇匹配最長的短語進(jìn)行翻譯。
顯而易見,若在翻譯過程中采用了上述的翻譯方法和匹配原則,則翻譯質(zhì)量會非常糟糕,讓觀看者難以理解,甚至誤導(dǎo)觀看者。
此外,該字幕翻譯引擎只能夠?qū)σ曨l源中的字幕進(jìn)行實(shí)時在線翻譯,而不能對字幕作離線的預(yù)翻譯,縮小了翻譯引擎的使用范圍,不利于推廣使用。
發(fā)明內(nèi)容
本發(fā)明的目的在于克服現(xiàn)有的字幕自動翻譯方法或裝置翻譯質(zhì)量差、使用范圍較小的缺陷,從而提供一種翻譯準(zhǔn)確度更高、適用范圍更廣的字幕自動翻譯方法。
為了實(shí)現(xiàn)上述目的,本發(fā)明提供了一種數(shù)字視頻字幕自動翻譯方法,用于將來自數(shù)字視頻源的字幕內(nèi)容翻譯成另一種語言,所述方法包括以下步驟:
1)、從來自所述數(shù)字視頻源的傳輸流中提取用源語言表示的字幕內(nèi)容,并將字幕內(nèi)容從圖像格式轉(zhuǎn)換為文本格式;
2)、對轉(zhuǎn)換后的字幕內(nèi)容進(jìn)行語種判別,判斷所述的源語言為何種語言;
3)、根據(jù)源語言的類別和用戶設(shè)定的所要翻譯的目標(biāo)語言的類別,選擇從源語言到目標(biāo)語言的翻譯短語表,所述翻譯短語表中包括源語言短語、與源語言短語具有相同含義的目標(biāo)語言短語,以及所述的源語言短語和所述的目標(biāo)語言短語間的翻譯概率;
4)、根據(jù)目標(biāo)語言的語種類別,提取目標(biāo)語言的語言模型;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國科學(xué)院計(jì)算技術(shù)研究所,未經(jīng)中國科學(xué)院計(jì)算技術(shù)研究所許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200610087132.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





