[發(fā)明專利]一種字幕生成方法、裝置及計算機存儲介質(zhì)、電子設(shè)備在審
| 申請?zhí)枺?/td> | 201911047803.1 | 申請日: | 2019-10-30 |
| 公開(公告)號: | CN110798733A | 公開(公告)日: | 2020-02-14 |
| 發(fā)明(設(shè)計)人: | 崔建偉;蔡賀;黃建新;張歆;黃偉峰;朱米春;杜偉;王一韓;閆磊;錢岳 | 申請(專利權(quán))人: | 中央電視臺 |
| 主分類號: | H04N21/439 | 分類號: | H04N21/439;H04N21/488;H04N21/81;H04N21/845 |
| 代理公司: | 11397 北京新知遠方知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人: | 馬軍芳;張艷 |
| 地址: | 100789 北京市朝陽*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 時間碼信息 文本數(shù)據(jù) 音頻文件 匹配 文稿 計算機存儲介質(zhì) 電視節(jié)目 電子設(shè)備 時碼信息 語音內(nèi)容 語音識別 自動匹配 字幕生成 字幕文本 字幕文件 時間碼 轉(zhuǎn)寫 節(jié)目 字幕 文本 申請 | ||
一種字幕生成方法、裝置及計算機存儲介質(zhì)、電子設(shè)備,包括:確定節(jié)目的音頻文件;將所述音頻文件轉(zhuǎn)寫為文字,得到音頻文件對應(yīng)的帶有時間碼信息的文本數(shù)據(jù);將所述文本數(shù)據(jù)與所述節(jié)目的標準文稿進行匹配;根據(jù)匹配后的結(jié)果將所述文本數(shù)據(jù)的時間碼信息附加給所述標準文稿,得到帶時間碼信息的字幕文件。采用本申請中的方案,通過對音頻做語音識別實現(xiàn)電視節(jié)目字幕和語音內(nèi)容的自動匹配,使得音頻與文本時間碼同步,字幕文本具有時碼信息。
技術(shù)領(lǐng)域
本申請涉及節(jié)目制作技術(shù),具體地,涉及一種字幕生成方法、裝置及計算 機存儲介質(zhì)、電子設(shè)備。
背景技術(shù)
在傳媒行業(yè)的音視頻后期字幕制作環(huán)節(jié),電視節(jié)目的字幕和語音內(nèi)容無法 自動匹配,但是電視節(jié)目播出時需要將音頻和字幕同步。目前,在字幕制作時, 工作人員需要通過字幕軟件進行時間軸拍打,制作字幕的過程包括:
第一步:工作人員需要先將聽寫好的字幕文件導(dǎo)入字幕軟件;
第二步:然后再導(dǎo)入相對應(yīng)的音視頻文件;
第三步:打開時間軸制作;
第四步:拍打確定第一句話時間碼的開始時間;
第五步:拍打確定第一句話時間碼的結(jié)束時間;
第六步:核對第一句話時間碼的開始時間和結(jié)束時間是否正確;
第七步:重復(fù)上述第四、五、六步,拍打第二句話以及后面句子的時間碼;
...
第N步:導(dǎo)出srt文件。
從上面過程可以看出,時間碼軸環(huán)節(jié)是最為細小且最為繁瑣的環(huán)節(jié)。工作 人員需要一邊聽音頻、一邊看視頻中人物的口型、一邊拍打時間軸,并且在每 拍打完一句話的時間軸時候需要重新播放當(dāng)前音視頻片段進行核對。在這種情 況下,一旦其中某句話的時間碼拍打錯誤或處于某些原因需要進行修改,將直 接影響后面關(guān)聯(lián)的句子的時間軸的修改。
現(xiàn)有技術(shù)中存在的問題:
目前傳媒行業(yè),特別是廣電行業(yè)需要播出海量的音視頻節(jié)目,每一檔節(jié)目 都需要工作人員進行“純手工”的匹配字幕。以視頻的字幕為例,工作人員在 進行手工匹配時需要視頻、音頻、字幕三方同時兼顧,并且需要反復(fù)聽寫、反 復(fù)校對,過程繁瑣且效率低下。而且,如果工作人員發(fā)現(xiàn)其中一句需要重新修 改時間碼,需要重新修改后面受關(guān)聯(lián)影響的時間碼。
發(fā)明內(nèi)容
本申請實施例中提供了一種字幕生成方法、裝置及計算機存儲介質(zhì)、電子 設(shè)備,以解決上述技術(shù)問題。
根據(jù)本申請實施例的第一個方面,提供了一種字幕生成方法,包括如下步 驟:
確定節(jié)目的音頻文件;
將所述音頻文件轉(zhuǎn)寫為文字,得到音頻文件對應(yīng)的帶有時間碼信息的文本 數(shù)據(jù);
將所述文本數(shù)據(jù)與所述節(jié)目的標準文稿進行匹配;
根據(jù)匹配后的結(jié)果將所述文本數(shù)據(jù)的時間碼信息附加給所述標準文稿,得 到帶時間碼信息的字幕文件。
根據(jù)本申請實施例的第二個方面,提供了一種字幕生成裝置,包括:
音頻確定模塊,用于確定節(jié)目的音頻文件;
文本生成模塊,用于將所述音頻文件轉(zhuǎn)寫為文字,得到音頻文件對應(yīng)的帶 有時間碼信息的文本數(shù)據(jù);
匹配模塊,用于將所述文本數(shù)據(jù)與所述節(jié)目的標準文稿進行匹配;
附時碼模塊,用于根據(jù)匹配后的結(jié)果將所述文本數(shù)據(jù)的時間碼信息附加給 所述標準文稿,得到帶時間碼信息的字幕文件。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中央電視臺,未經(jīng)中央電視臺許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911047803.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
H04N 圖像通信,如電視
H04N21-00 可選的內(nèi)容分發(fā),例如交互式電視,VOD〔視頻點播〕
H04N21-20 .專門適用于內(nèi)容分發(fā)的專用服務(wù)器,例如:VOD服務(wù)器;其操作
H04N21-40 .專門適用于接收內(nèi)容或者與內(nèi)容交互的客戶端設(shè)備,如STB[機頂盒];相關(guān)操作
H04N21-60 .用于在服務(wù)器和客戶端之間或者在遠程客戶端之間的視頻分配的網(wǎng)絡(luò)結(jié)構(gòu)或者處理
H04N21-80 .通過內(nèi)容產(chǎn)生器獨立于分配過程實現(xiàn)的內(nèi)容或附加數(shù)據(jù)的生成或處理;內(nèi)容本身
H04N21-81 ..其單媒體部件
- 一種韻律預(yù)測方法及系統(tǒng)
- 一種基于KNN技術(shù)的語料庫文本分類方法
- 文本數(shù)據(jù)標注方法及裝置、存儲介質(zhì)、電子設(shè)備
- 數(shù)據(jù)采集方法、裝置、設(shè)備及計算機可讀存儲介質(zhì)
- 文本的處理、文本分類模型的訓(xùn)練方法及裝置
- 文本加密方法及裝置、終端設(shè)備、存儲介質(zhì)
- 文本數(shù)據(jù)處理方法、裝置、電子設(shè)備及存儲介質(zhì)
- 富文本數(shù)據(jù)處理方法、裝置、計算機設(shè)備及存儲介質(zhì)
- 文本分類模型構(gòu)建、文本分類方法及裝置
- 文本匹配方法、裝置、設(shè)備及存儲介質(zhì)





