[發(fā)明專利]一種視頻剪輯方法及裝置在審
| 申請?zhí)枺?/td> | 201810140691.3 | 申請日: | 2018-02-11 |
| 公開(公告)號: | CN108391064A | 公開(公告)日: | 2018-08-10 |
| 發(fā)明(設計)人: | 李景頡 | 申請(專利權)人: | 北京秀眼科技有限公司 |
| 主分類號: | H04N5/262 | 分類號: | H04N5/262;G10L15/26 |
| 代理公司: | 北京成創(chuàng)同維知識產權代理有限公司 11449 | 代理人: | 范芳茗;高青 |
| 地址: | 100102 北京市朝*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 音頻文件 文本 視頻剪輯 時間標記 剪輯 第一時間標記 文本生成 剪切 轉換 | ||
1.一種視頻剪輯方法,包括:
獲取第一音頻文件和第二音頻文件;
識別所述第一音頻文件和所述第二音頻文件,并生成第一文本和第二文本,所述第一文本包括第一時間標記,所述第二文本包括第二時間標記;
根據(jù)所述第一文本和所述第二文本生成第三文本,所述第三文本包括第三時間標記,
剪切所述第一音頻文件和所述第二音頻文件,以生成第三音頻文件,其中,所述第一文本包括多個第一文本段,所述第一時間標記包括對應于所述多個第一文本段的多個時間信息,所述第二文本包括多個第二文本段,所述第二時間標記包括對應于所述多個第二文本段的多個時間信息,所述第三文本包括多個第三文本段,所述第三時間標記包括對應于所述多個第三文本段的多個時間信息,所述多個第三文本段由所述多個第一文本段和所述多個第二文本段中的一個或多個構成,所述第三時間標記根據(jù)所述多個第三文本段和所述多個第一文本段、所述多個第二文本段在內容上的對應關系生成。
2.根據(jù)權利要求1所述的視頻剪輯方法,其中,所述第一音頻文件根據(jù)A機位拍攝視頻獲得,所述第二音頻文件根據(jù)B機位拍攝視頻獲得。
3.根據(jù)權利要求2所述的視頻剪輯方法,還包括:以所述第三音頻文件替換所述第一音頻文件或所述第二音頻文件,得到新的視頻,其中,所述第一音頻文件或所述第二音頻文件為視頻的音頻文件。
4.根據(jù)權利要求1所述的視頻剪輯方法,其中,所述剪切所述第一音頻文件和所述第二音頻文件,以生成第三音頻文件包括:
根據(jù)所述對應關系從所述第一音頻文件和/或所述第二音頻文件中切割出多個音頻片段;以及
將所述多個音頻片段組合成所述第三音頻文件。
5.根據(jù)權利要求1所述的視頻剪輯方法,還包括:格式轉換模塊,在所述識別所述第一音頻文件和所述第二音頻文件的步驟之前,將所述第一音頻文件和所述第二音頻文件從一種音頻格式轉換成另一種音頻格式。
6.根據(jù)權利要求1至5任一項所述的視頻剪輯方法,所述第一時間標記、所述第二時間標記和所述第三時間標記至少包括下述列表中的一種信息:
開始時間和結束時間,表示相應的文本段的開始和結束時間;
持續(xù)時間,表示相應的文本段的時間長度。
7.一種視頻剪輯裝置,包括:
音頻獲取模塊,用于獲取第一音頻文件和第二音頻文件;
語音識別模塊,用于識別所述第一音頻文件和所述第二音頻文件,并生成第一文本和第二文本,所述第一文本包括第一時間標記,所述第二文本包括第二時間標記;
文本剪輯模塊,用于生成第三文本,所述第三文本包括第三時間標記;
音頻剪切模塊,用于根據(jù)所述第三文本剪切所述第一音頻文件和所述第二音頻文件,并生成第三音頻文件,
其中,所述第一文本包括多個第一文本段,所述第一時間標記包括對應于所述多個第一文本段的多個時間信息,所述第二文本包括多個第二文本段,所述第二時間標記包括對應于所述多個第二文本段的多個時間信息,所述第三文本包括多個第三文本段,所述第三時間標記包括對應于所述多個第三文本段的多個時間信息,所述多個第三文本段由所述多個第一文本段和所述多個第二文本段中的一個或多個構成,所述第三時間標記根據(jù)所述多個第三文本段和所述多個第一文本段、所述多個第二文本段在內容上的對應關系生成。
8.根據(jù)權利要求7所述的視頻剪輯裝置,其中,所述音頻獲取模塊根據(jù)A機位拍攝視頻獲得所述第一音頻文件,根據(jù)B機位拍攝視頻獲得所述第二音頻文件。
9.根據(jù)權利要求8所述的視頻剪輯裝置,還包括:音頻替換模塊,用于以所述第三音頻文件替換所述第一音頻文件或第二音頻文件,以得到新的視頻,其中,所述第一音頻文件或所述第二音頻文件為視頻的音頻文件。
10.根據(jù)權利要求7所述的視頻剪輯裝置,其中,所述音頻剪切模塊包括:
剪切單元,用于根據(jù)所述對應關系和所述第三標記從所述第一音頻文件和/或所述第二音頻文件中切割出多個音頻片段;
合成單元,用于將所述多個音頻片段組合成所述第三音頻文件。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京秀眼科技有限公司,未經北京秀眼科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810140691.3/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:視頻剪輯方法及裝置
- 下一篇:一種高清視頻實時半透明疊加方法





