[發(fā)明專利]一種數(shù)字視頻字幕自動翻譯方法無效
| 申請?zhí)枺?/td> | 200610087132.8 | 申請日: | 2006-06-13 |
| 公開(公告)號: | CN101090461A | 公開(公告)日: | 2007-12-19 |
| 發(fā)明(設計)人: | 錢躍良;熊德意;劉群 | 申請(專利權(quán))人: | 中國科學院計算技術(shù)研究所 |
| 主分類號: | H04N5/278 | 分類號: | H04N5/278 |
| 代理公司: | 北京泛華偉業(yè)知識產(chǎn)權(quán)代理有限公司 | 代理人: | 高存秀 |
| 地址: | 100080北京*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 數(shù)字視頻 字幕 自動 翻譯 方法 | ||
1、一種數(shù)字視頻字幕自動翻譯方法,所述方法包括以下步驟:
1)、從來自所述數(shù)字視頻源的傳輸流中提取用源語言表示的字幕內(nèi)容,并將字幕內(nèi)容從圖像格式轉(zhuǎn)換為文本格式;
2)、對轉(zhuǎn)換后的字幕內(nèi)容進行語種判別,判斷所述的源語言為何種語言;
3)、根據(jù)源語言的類別和用戶設定的所要翻譯的目標語言的類別,選擇從源語言到目標語言的翻譯短語表,所述翻譯短語表中包括源語言短語、與源語言短語具有相同含義的目標語言短語,以及所述的源語言短語和所述的目標語言短語間的翻譯概率;
4)、根據(jù)目標語言的語種類別,提取目標語言的語言模型;
5)、將字幕中用源語言表示的語句劃分成短語,并根據(jù)步驟3)得到的翻譯短語表查找短語在目標語言中的含義;
在所述的語句劃分成短語的過程中,一個語句有不同的劃分方法,將所有的劃分都列出;
在所述的查找短語在目標語言中的含義時,將短語在目標語言中的所有的含義都列出;
6)、從左至右,將短語在目標語言中的含義順次連接,形成目標譯文,將已經(jīng)連接好的目標譯文稱為部分翻譯,在連接過程中,將部分翻譯與下一個可能的短語的可能譯文進行連接,形成新的部分翻譯,并計算新的部分翻譯的分數(shù);重復上述的連接過程,直到整句話翻譯完畢;其中,
所述的計算新的部分翻譯的分數(shù)包括:
a、初始的部分翻譯,即沒有翻譯任何源語言單詞的空翻譯,其分數(shù)為1;
b、當前新生成的部分翻譯的短語的翻譯概率為:上一個部分翻譯的短語翻譯概率乘以被連接上的短語的翻譯概率;所述短語的翻譯概率由步驟3)得到的翻譯短語表得到;
當前新生成的部分翻譯的語言模型概率為:上一個部分翻譯的語言模型概率乘以被連接上的短語的語言模型概率;所述的連接上的短語的語言模型概率是以上一個部分翻譯的最后兩個單詞作為前驅(qū)歷史計算得到的;
c、將部分翻譯的短語翻譯概率乘以語言模型概率,就得到該部分翻譯的分數(shù);
在上述翻譯過程中,覆蓋相同源語言部分的部分翻譯都保存在同一個堆棧中,每個堆棧只保留分數(shù)最高的前N個結(jié)果,所述N的取值在10至100之間;
7)、在存放整句翻譯結(jié)果的堆棧中,選擇分數(shù)最高的翻譯結(jié)果作為字幕中的語句在目標語言中的含義;
8)、將翻譯后的字幕內(nèi)容由文本格式重新轉(zhuǎn)換為傳輸流接受的格式,并復合到傳輸流中輸出。
2、根據(jù)權(quán)利要求1所述的數(shù)字視頻字幕自動翻譯方法,其特征在于,在所述的步驟1)中,所述的文本格式包括Unicode格式。
3、根據(jù)權(quán)利要求1所述的數(shù)字視頻字幕自動翻譯方法,其特征在于,在所述的步驟1)中,采用光學字符識別引擎將所述的字幕內(nèi)容從圖像格式轉(zhuǎn)換為文本格式。
4、根據(jù)權(quán)利要求1所述的數(shù)字視頻字幕自動翻譯方法,其特征在于,在所述的步驟3)中,所述的翻譯短語表通過詞典獲取或從平行語料庫中獲取。
5、根據(jù)權(quán)利要求1所述的數(shù)字視頻字幕自動翻譯方法,其特征在于,在所述的步驟3)中,所述的翻譯概率為源語言短語和目標語言短語互譯次數(shù)除以源語言短語出現(xiàn)次數(shù)后得到的值。
6、根據(jù)權(quán)利要求1所述的數(shù)字視頻字幕自動翻譯方法,其特征在于,在所述的步驟4)中,所述的目標語言的語言模型為3-gram模型。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國科學院計算技術(shù)研究所,未經(jīng)中國科學院計算技術(shù)研究所許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200610087132.8/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:鍋爐熱水補水器
- 下一篇:無谷物原糧或少谷物原糧型食草動物精料補充飼料





