[發(fā)明專利]會議視頻字幕合成系統(tǒng)和方法在審
| 申請?zhí)枺?/td> | 202010621997.8 | 申請日: | 2020-07-01 |
| 公開(公告)號: | CN111787267A | 公開(公告)日: | 2020-10-16 |
| 發(fā)明(設(shè)計)人: | 田渭霞;張軍;肖康 | 申請(專利權(quán))人: | 廣州科天視暢信息科技有限公司 |
| 主分類號: | H04N7/15 | 分類號: | H04N7/15;H04N5/278;H04N5/265;H04N5/76;H04N21/43;G10L15/26;G06F40/58 |
| 代理公司: | 深圳紫藤知識產(chǎn)權(quán)代理有限公司 44570 | 代理人: | 遠明 |
| 地址: | 510000 廣東省廣州市中*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 會議 視頻 字幕 合成 系統(tǒng) 方法 | ||
1.一種會議視頻字幕合成系統(tǒng),其特征在于,包括:
目標視頻錄制模塊,字幕翻譯控制模塊,字幕生成模塊和字幕合成模塊;
所述目標視頻錄制模塊用于錄制目標視頻,記錄所述目標視頻的時間同步信息;
所述字幕翻譯控制模塊用于開啟字幕翻譯功能和關(guān)閉字幕翻譯功能;
所述字幕生成模塊用于確定所述字幕翻譯功能開啟,對所述目標視頻進行語音識別,生成字幕數(shù)據(jù),記錄所述字幕數(shù)據(jù)的時間信息;
所述字幕合成模塊用于根據(jù)所述時間信息和所述時間同步信息,融合所述目標視頻和所述字幕數(shù)據(jù),形成共享字幕視頻。
2.根據(jù)權(quán)利要求1所述的系統(tǒng),其特征在于,所述目標視頻錄制模塊,包括:
屏幕共享視頻錄制模塊,用于錄制屏幕共享視頻,記錄所述屏幕共享視頻的第一時間同步信息;
無屏幕共享視頻錄制模塊,用于錄制無屏幕共享視頻,記錄所述無屏幕共享視頻的第二時間同步信息。
3.根據(jù)權(quán)利要求2所述的系統(tǒng),其特征在于,包括:
分辨率調(diào)整模塊,用于將所述屏幕共享視頻的分辨率和所述無屏幕共享視頻的分辨率調(diào)整為一致;
視頻拼接模塊,用于根據(jù)所述屏幕共享視頻和所述無屏幕共享視頻錄制時間的先后次序,拼接所述屏幕共享視頻和所述無屏幕共享視頻,形成共享視頻。
4.根據(jù)權(quán)利要求3所述的系統(tǒng),其特征在于,包括:
會議視頻錄制模塊,用于錄制包括會議現(xiàn)場環(huán)境的會議視頻;
視頻融合模塊,用于根據(jù)所述第一時間同步信息和所述第二時間同步信息,將所述會議視頻融合至所述共享視頻的右上角,形成全視角共享視頻。
5.根據(jù)權(quán)利要求1所述的系統(tǒng),其特征在于,包括:
會議視頻錄制模塊,用于錄制包括會議現(xiàn)場環(huán)境的會議視頻;
視頻融合模塊,用于根據(jù)所述時間同步信息,將所述會議視頻融合至所述共享字幕視頻的右上角,形成全視角共享字幕視頻。
6.根據(jù)權(quán)利要求1所述的系統(tǒng),其特征在于,所述時間同步信息包括開始錄制時間、結(jié)束錄制時間、視頻包含的數(shù)據(jù)幀的開始時間和結(jié)束時間,所述時間信息包括開始翻譯時間和結(jié)束翻譯時間。
7.根據(jù)權(quán)利要求1所述的系統(tǒng),其特征在于,所述字幕數(shù)據(jù)包括第一字幕數(shù)據(jù)和至少一第二字幕數(shù)據(jù),所述第一字幕數(shù)據(jù)的語言類型與所述目標視頻的語言類型一致,所述第二字幕數(shù)據(jù)與所述第一字幕數(shù)據(jù)的語言類型不同。
8.一種會議視頻字幕合成方法,其特征在于,包括:
錄制目標視頻,記錄所述目標視頻的時間同步信息;
開啟字幕翻譯功能,對所述目標視頻進行語音識別,生成字幕數(shù)據(jù),記錄所述字幕數(shù)據(jù)的時間信息;
根據(jù)所述時間信息和所述時間同步信息,融合所述目標視頻和所述字幕數(shù)據(jù),形成共享字幕視頻。
9.根據(jù)權(quán)利要求8所述的方法,其特征在于,所述錄制目標視頻,記錄所述目標視頻的時間同步信息,包括:
錄制屏幕共享視頻,記錄所述屏幕共享視頻的第一時間同步信息;
錄制無屏幕共享視頻,記錄所述無屏幕共享視頻的第二時間同步信息;
將所述屏幕共享視頻和所述無屏幕共享視頻的分辨率調(diào)整為一致;
根據(jù)所述屏幕共享視頻和所述無屏幕共享視頻錄制時間的先后次序,拼接所述屏幕共享視頻和所述無屏幕共享視頻,形成共享視頻。
10.根據(jù)權(quán)利要求8所述的方法,其特征在于,所述根據(jù)所述時間信息和所述時間同步信息,融合所述目標視頻和所述字幕數(shù)據(jù),包括:
根據(jù)所述時間同步信息,獲取所述目標視頻包括的數(shù)據(jù)幀的開始時間和結(jié)束時間;
根據(jù)所述時間信息,獲取所述字幕數(shù)據(jù)的開始翻譯時間和結(jié)束翻譯時間;
對應(yīng)所述開始翻譯時間和所述開始時間,對應(yīng)所述結(jié)束翻譯時間與所述結(jié)束時間,結(jié)合相應(yīng)的所述字幕數(shù)據(jù)和所述數(shù)據(jù)幀。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廣州科天視暢信息科技有限公司,未經(jīng)廣州科天視暢信息科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010621997.8/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種交流單相電機的調(diào)速方法
- 下一篇:一種語音激勵控制方法及裝置





