[發(fā)明專利]自動生成演示視頻的方法、系統(tǒng)、設(shè)備及存儲介質(zhì)有效
| 申請?zhí)枺?/td> | 202010301638.4 | 申請日: | 2020-04-16 |
| 公開(公告)號: | CN111538851B | 公開(公告)日: | 2023-09-12 |
| 發(fā)明(設(shè)計(jì))人: | 焦金珂;李健;武衛(wèi)東 | 申請(專利權(quán))人: | 北京捷通華聲科技股份有限公司 |
| 主分類號: | G06F16/438 | 分類號: | G06F16/438;G10L13/02;G10L13/08;H04N5/04;H04N5/278 |
| 代理公司: | 北京潤澤恒知識產(chǎn)權(quán)代理有限公司 11319 | 代理人: | 莎日娜 |
| 地址: | 100193 北京市海淀區(qū)東北*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 自動 生成 演示 視頻 方法 系統(tǒng) 設(shè)備 存儲 介質(zhì) | ||
本申請?zhí)峁┝艘环N自動生成演示視頻的方法、系統(tǒng)、設(shè)備及存儲介質(zhì),涉及數(shù)據(jù)處理技術(shù)領(lǐng)域。旨在達(dá)到無需人工錄制講解語音,自動將PPT文件生成具有配音和字幕的視頻的目的。所述方法包括:逐一將演示文稿中的每頁幻燈片依次作為當(dāng)前幻燈片;根據(jù)所述當(dāng)前幻燈片的顯示文字和備注講解文字,生成音頻片段;根據(jù)所述音頻片段的時長,設(shè)置所述當(dāng)前幻燈片在視頻中的顯示時長;根據(jù)所述每頁幻燈片對應(yīng)的顯示時長,依次疊加所述每頁幻燈片,得到無聲視頻;依次將所述每頁幻燈片對應(yīng)的音頻片段添加到所述無聲視頻,生成演示視頻。
技術(shù)領(lǐng)域
本申請涉及數(shù)據(jù)處理技術(shù)領(lǐng)域,特別是涉及一種自動生成演示視頻的方法、系統(tǒng)、設(shè)備及存儲介質(zhì)。
背景技術(shù)
在線的課堂,或者大型演講、大型會議等場景下,會以視頻播放講解的內(nèi)容。課堂的場景下,老師會事先將授課內(nèi)容編輯在PPT文件中,以圖文并茂的形式展現(xiàn)授課內(nèi)容,再通過播放PPT文件,同時錄制語音的方式,制作完成在課堂上播放的視頻。在大型會議的場景或者大型演講的景下,用戶會事先將報告內(nèi)容或者演講內(nèi)容編輯在PPT文件中,以圖表等方式展示講解的內(nèi)容,再通過播放PPT文件,同時錄制語音的方式,完成演講視頻,或者報告視頻的錄制。同時PowerPoint軟件自帶的視頻導(dǎo)出功能,也需要在PPT文件中插入音頻或者需要事先錄制好旁白,并且對PowerPoint軟件的版本要求較高。
上述基于PPT文件得到視頻的方法,或者需要使用第三方的屏幕錄制軟件,或者需要用戶手動點(diǎn)擊PPT,逐頁放映并且演講人需要在放映過程中講話,十分繁瑣,耗費(fèi)時間和精力。
發(fā)明內(nèi)容
本申請實(shí)施例提供了一種自動生成演示視頻的方法、系統(tǒng)、設(shè)備及存儲介質(zhì),旨在達(dá)到無需手動點(diǎn)擊放映,無需人工錄制講解語音,自動將PPT文件生成具有配音和字幕的視頻的目的。
本申請實(shí)施例第一方面提供一種自動生成演示視頻的方法,所述方法包括:
逐一將演示文稿中的每頁幻燈片依次作為當(dāng)前幻燈片;
根據(jù)所述當(dāng)前幻燈片的顯示文字和備注講解文字,生成音頻片段;
根據(jù)所述音頻片段的時長,設(shè)置所述當(dāng)前幻燈片在視頻中的顯示時長;
根據(jù)所述每頁幻燈片對應(yīng)的顯示時長,依次疊加所述每頁幻燈片,得到無聲視頻;
依次將所述每頁幻燈片對應(yīng)的音頻片段添加到所述無聲視頻,生成演示視頻。
可選地,所述方法還包括:
讀取并記錄所述演示文稿的總頁碼數(shù);
將所述當(dāng)前幻燈片轉(zhuǎn)換為圖片;
以所述當(dāng)前幻燈片的頁碼,對所述圖片進(jìn)行編號;
以所述當(dāng)前幻燈片的頁碼,對文本內(nèi)容進(jìn)行編號;所述文本內(nèi)容是提取所述當(dāng)前幻燈片的顯示文字和備注講解文字中的至少一種文字得到的;
以所述文本內(nèi)容的編號作為所述音頻片段的編號;
根據(jù)所述音頻片段的時長,設(shè)置所述當(dāng)前幻燈片在視頻中的顯示時長,包括:
根據(jù)所述音頻片段的時長,編輯所述圖片的幀數(shù);
以編輯幀數(shù)后的圖片作為顯示圖片幀;
根據(jù)所述每頁幻燈片對應(yīng)的顯示時長,依次疊加所述每頁幻燈片,得到無聲視頻,包括:
在所有音頻片段的編號和所有圖片的編號一一對應(yīng)時,以所述圖片的編號,作為所述顯示圖片幀的顯示次序;
按照所述每頁幻燈片對應(yīng)的顯示圖片幀的顯示次序,疊加所述每頁幻燈片對應(yīng)的顯示圖片幀,得到所述無聲視頻。
可選地,以所述當(dāng)前幻燈片的頁碼,對文本內(nèi)容進(jìn)行編號,包括:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京捷通華聲科技股份有限公司,未經(jīng)北京捷通華聲科技股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010301638.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





