[發(fā)明專利]視頻字幕的生成方法及系統(tǒng)有效

申請?zhí)枺?/td>	201310018669.9	申請日：	2013-01-17
公開（公告）號：	CN103945140B	公開（公告）日：	2017-11-28
發(fā)明（設(shè)計(jì)）人：	趙永剛	申請（專利權(quán)）人：	聯(lián)想(北京)有限公司
主分類號：	H04N5/278	分類號：	H04N5/278;H04N21/83
代理公司：	北京集佳知識產(chǎn)權(quán)代理有限公司11227	代理人：	王寶筠
地址：	100085 北京市***	國省代碼：	北京;11
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	視頻字幕生成方法系統(tǒng)
鉆瓜網(wǎng) 技術(shù)展會專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【權(quán)利要求書】：

1.一種視頻字幕生成方法，其特征在于，包括：

檢測視頻中與字幕對應(yīng)的語音提供者的視頻字幕播放類型控制信息；

獲取與所述視頻字幕播放類型控制信息相匹配的視頻字幕播放信息；

確定與所述視頻字幕播放信息對應(yīng)的視頻字幕動畫模型，其中，反應(yīng)當(dāng)前語音提供者不同心情的視頻字幕播放信息所對應(yīng)的視頻字幕動畫模型不同，所述視頻字幕動畫模型中的參數(shù)用于控制生成的視頻字幕的動畫效果的程度，以便通過調(diào)整視頻字幕動畫模型的參數(shù)，生成不同動畫效果程度的視頻字幕；

提取視頻字幕文字信息；

采用所述視頻字幕動畫模型轉(zhuǎn)化所述視頻字幕文字信息，生成視頻字幕。

2.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述檢測視頻字幕播放類型控制信息包括：

采集視頻中與字幕對應(yīng)的語音提供者的人臉表情信息。

3.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述檢測視頻字幕播放類型控制信息包括：

接收用戶輸入視頻字幕播放類型控制信息。

4.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述檢測視頻字幕播放類型控制信息包括：

采集視頻中與字幕對應(yīng)的語音提供者的音調(diào)；

計(jì)算預(yù)設(shè)時間段的音調(diào)變化，確定與所述音調(diào)變化對應(yīng)的視頻字幕播放類型控制信息。

5.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述提取視頻字幕文字信息包括：

采集視頻中與字幕對應(yīng)的語音提供者的語音信息；

識別所述語音信息，生成與所述語音對應(yīng)的文字信息。

6.根據(jù)權(quán)利要求1-5中任意一項(xiàng)所述的方法，其特征在于，生成視頻字幕之前還包括：

采集視頻中與字幕對應(yīng)的語音提供者的語音音量；

根據(jù)所述語音音量調(diào)整所述視頻字幕動畫模型的參數(shù)。

7.一種視頻字幕生成系統(tǒng)，其特征在于，包括：

檢測器，用于檢測視頻中與字幕對應(yīng)的語音提供者的視頻字幕播放類型控制信息；

處理器，用于獲取與所述視頻字幕播放類型控制信息相匹配的視頻字幕播放信息；確定與所述視頻字幕播放信息對應(yīng)的視頻字幕動畫模型；提取視頻字幕文字信息；采用所述視頻字幕動畫模型制作所述視頻字幕文字信息，生成視頻字幕；

其中，反應(yīng)當(dāng)前語音提供者不同心情的視頻字幕播放信息所對應(yīng)的視頻字幕動畫模型不同，所述視頻字幕動畫模型中的參數(shù)用于控制生成的視頻字幕的動畫效果的程度，以便通過調(diào)整視頻字幕動畫模型的參數(shù)，生成不同動畫效果程度的視頻字幕。

8.根據(jù)權(quán)利要求7所述的系統(tǒng)，其特征在于，所述檢測器為圖像采集器，用于采集視頻中與字幕對應(yīng)的語音提供者的人臉表情信息。

9.根據(jù)權(quán)利要求7所述的系統(tǒng)，其特征在于，所述檢測器為接收器，用于接收用戶輸入的視頻字幕播放類型控制信息。

10.根據(jù)權(quán)利要求7所述的系統(tǒng)，其特征在于，所述檢測器為語音采集器，用于采集視頻中與字幕對應(yīng)的語音提供者的音調(diào)；

所述處理器還用于獲取所述音調(diào)，計(jì)算預(yù)設(shè)時間段的音調(diào)變化，確定與所述音調(diào)變化對應(yīng)的視頻字幕播放類型控制信息。

11.根據(jù)權(quán)利要求7所述的系統(tǒng)，其特征在于，所述處理器提取視頻字幕文字信息的方式包括：

采集視頻中與字幕對應(yīng)的語音提供者的語音信息；

識別所述語音信息，生成與所述語音對應(yīng)的文字信息。

12.根據(jù)權(quán)利要求7-11任意一項(xiàng)所述的系統(tǒng)，其特征在于，所述處理器還用于在生成視頻字幕之前，采集視頻中與字幕對應(yīng)的語音提供者的語音音量；根據(jù)所述語音音量調(diào)整所述視頻字幕動畫模型的參數(shù)。

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會員可以免費(fèi)下載。

免登錄下載普通用戶下載升級VIP會員，免費(fèi)下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于聯(lián)想(北京)有限公司，未經(jīng)聯(lián)想(北京)有限公司許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201310018669.9/1.html，轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

上一篇：高效雙焊頭組合焊接裝置
下一篇：一種液壓支架焊接系統(tǒng)及其焊接方法

同類專利

專利分類

H 電學(xué)

H04 電通信技術(shù)
H04N 圖像通信，如電視
H04N5-00 電視系統(tǒng)的零部件
H04N5-04 .同步
H04N5-14 .視頻圖像信號電路
H04N5-222 .電視演播室線路；電視演播室裝置；電視演播室設(shè)備
H04N5-30 .轉(zhuǎn)變光或模擬信息為電信號
H04N5-38 .發(fā)射機(jī)電路

免登錄下載普通用戶下載升級VIP會員，免費(fèi)下載

專利文獻(xiàn)下載

說明：

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書；

2、支持發(fā)明專利、實(shí)用新型專利、外觀設(shè)計(jì)專利（升級中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進(jìn)行下載，點(diǎn)擊【登陸】【注冊】