[發(fā)明專利]視頻字幕的生成方法及系統(tǒng)有效
| 申請?zhí)枺?/td> | 201310018669.9 | 申請日: | 2013-01-17 |
| 公開(公告)號: | CN103945140B | 公開(公告)日: | 2017-11-28 |
| 發(fā)明(設(shè)計(jì))人: | 趙永剛 | 申請(專利權(quán))人: | 聯(lián)想(北京)有限公司 |
| 主分類號: | H04N5/278 | 分類號: | H04N5/278;H04N21/83 |
| 代理公司: | 北京集佳知識產(chǎn)權(quán)代理有限公司11227 | 代理人: | 王寶筠 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 視頻 字幕 生成 方法 系統(tǒng) | ||
1.一種視頻字幕生成方法,其特征在于,包括:
檢測視頻中與字幕對應(yīng)的語音提供者的視頻字幕播放類型控制信息;
獲取與所述視頻字幕播放類型控制信息相匹配的視頻字幕播放信息;
確定與所述視頻字幕播放信息對應(yīng)的視頻字幕動畫模型,其中,反應(yīng)當(dāng)前語音提供者不同心情的視頻字幕播放信息所對應(yīng)的視頻字幕動畫模型不同,所述視頻字幕動畫模型中的參數(shù)用于控制生成的視頻字幕的動畫效果的程度,以便通過調(diào)整視頻字幕動畫模型的參數(shù),生成不同動畫效果程度的視頻字幕;
提取視頻字幕文字信息;
采用所述視頻字幕動畫模型轉(zhuǎn)化所述視頻字幕文字信息,生成視頻字幕。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述檢測視頻字幕播放類型控制信息包括:
采集視頻中與字幕對應(yīng)的語音提供者的人臉表情信息。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述檢測視頻字幕播放類型控制信息包括:
接收用戶輸入視頻字幕播放類型控制信息。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述檢測視頻字幕播放類型控制信息包括:
采集視頻中與字幕對應(yīng)的語音提供者的音調(diào);
計(jì)算預(yù)設(shè)時間段的音調(diào)變化,確定與所述音調(diào)變化對應(yīng)的視頻字幕播放類型控制信息。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述提取視頻字幕文字信息包括:
采集視頻中與字幕對應(yīng)的語音提供者的語音信息;
識別所述語音信息,生成與所述語音對應(yīng)的文字信息。
6.根據(jù)權(quán)利要求1-5中任意一項(xiàng)所述的方法,其特征在于,生成視頻字幕之前還包括:
采集視頻中與字幕對應(yīng)的語音提供者的語音音量;
根據(jù)所述語音音量調(diào)整所述視頻字幕動畫模型的參數(shù)。
7.一種視頻字幕生成系統(tǒng),其特征在于,包括:
檢測器,用于檢測視頻中與字幕對應(yīng)的語音提供者的視頻字幕播放類型控制信息;
處理器,用于獲取與所述視頻字幕播放類型控制信息相匹配的視頻字幕播放信息;確定與所述視頻字幕播放信息對應(yīng)的視頻字幕動畫模型;提取視頻字幕文字信息;采用所述視頻字幕動畫模型制作所述視頻字幕文字信息,生成視頻字幕;
其中,反應(yīng)當(dāng)前語音提供者不同心情的視頻字幕播放信息所對應(yīng)的視頻字幕動畫模型不同,所述視頻字幕動畫模型中的參數(shù)用于控制生成的視頻字幕的動畫效果的程度,以便通過調(diào)整視頻字幕動畫模型的參數(shù),生成不同動畫效果程度的視頻字幕。
8.根據(jù)權(quán)利要求7所述的系統(tǒng),其特征在于,所述檢測器為圖像采集器,用于采集視頻中與字幕對應(yīng)的語音提供者的人臉表情信息。
9.根據(jù)權(quán)利要求7所述的系統(tǒng),其特征在于,所述檢測器為接收器,用于接收用戶輸入的視頻字幕播放類型控制信息。
10.根據(jù)權(quán)利要求7所述的系統(tǒng),其特征在于,所述檢測器為語音采集器,用于采集視頻中與字幕對應(yīng)的語音提供者的音調(diào);
所述處理器還用于獲取所述音調(diào),計(jì)算預(yù)設(shè)時間段的音調(diào)變化,確定與所述音調(diào)變化對應(yīng)的視頻字幕播放類型控制信息。
11.根據(jù)權(quán)利要求7所述的系統(tǒng),其特征在于,所述處理器提取視頻字幕文字信息的方式包括:
采集視頻中與字幕對應(yīng)的語音提供者的語音信息;
識別所述語音信息,生成與所述語音對應(yīng)的文字信息。
12.根據(jù)權(quán)利要求7-11任意一項(xiàng)所述的系統(tǒng),其特征在于,所述處理器還用于在生成視頻字幕之前,采集視頻中與字幕對應(yīng)的語音提供者的語音音量;根據(jù)所述語音音量調(diào)整所述視頻字幕動畫模型的參數(shù)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于聯(lián)想(北京)有限公司,未經(jīng)聯(lián)想(北京)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310018669.9/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





