[發(fā)明專利]音視頻編輯方法、裝置及存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 201910001833.2 | 申請日: | 2019-01-02 |
| 公開(公告)號: | CN111405357A | 公開(公告)日: | 2020-07-10 |
| 發(fā)明(設(shè)計)人: | 耿軍;馬春陽;楊昌源;陳羽飛 | 申請(專利權(quán))人: | 阿里巴巴集團控股有限公司 |
| 主分類號: | H04N21/44 | 分類號: | H04N21/44;H04N21/439;H04N21/472 |
| 代理公司: | 北京林達劉知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11277 | 代理人: | 劉新宇 |
| 地址: | 英屬開曼群島大開*** | 國省代碼: | 暫無信息 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 視頻 編輯 方法 裝置 存儲 介質(zhì) | ||
1.一種音視頻編輯方法,其特征在于,包括:
對至少一個待剪輯視頻進行鏡頭檢測,確定所述至少一個待剪輯視頻中的至少一個鏡頭片段;
確定所述至少一個待剪輯視頻對應(yīng)的背景音頻中的轉(zhuǎn)折點;
合成所述至少一個鏡頭片段和所述背景音頻,使相鄰的鏡頭片段之間的鏡頭切換時間點和所述轉(zhuǎn)折點相匹配。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,確定所述至少一個待剪輯視頻對應(yīng)的背景音頻中的轉(zhuǎn)折點,包括以下一項或兩項:
根據(jù)所述背景音頻中的音符的能量,確定所述背景音頻中的轉(zhuǎn)折點;
根據(jù)所述背景音頻中的音符之間的時間間隔,確定所述背景音頻中的轉(zhuǎn)折點。
3.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,還包括:
確定所述轉(zhuǎn)折點的優(yōu)先級;
根據(jù)所述轉(zhuǎn)折點的優(yōu)先級,從所述轉(zhuǎn)折點中確定目標(biāo)轉(zhuǎn)折點;
合成所述至少一個鏡頭片段和所述背景音頻,使相鄰的鏡頭片段之間的鏡頭切換時間點和所述轉(zhuǎn)折點相匹配,包括:
合成所述至少一個鏡頭片段和所述背景音頻,使相鄰的鏡頭片段之間的鏡頭切換時間點和所述目標(biāo)轉(zhuǎn)折點相匹配。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,確定所述轉(zhuǎn)折點的優(yōu)先級,包括以下一項或兩項:
根據(jù)所述背景音頻的速度,確定不同類的轉(zhuǎn)折點的優(yōu)先級;
根據(jù)同類的不同轉(zhuǎn)折點對應(yīng)的音符的能量,確定同類的不同轉(zhuǎn)折點的優(yōu)先級。
5.根據(jù)權(quán)利要求2所述的方法,其特征在于,根據(jù)所述背景音頻中的音符的能量,確定所述背景音頻中的轉(zhuǎn)折點,包括:
若所述背景音頻中的第一音符的能量與第二音符的能量的比值大于第一閾值,則根據(jù)所述第一音符的出現(xiàn)時間確定所述背景音頻中的第一類轉(zhuǎn)折點,其中,所述第一音符為所述第二音符的下一個音符;或者,
若所述第一音符的能量與所述第二音符的能量的差值大于第二閾值,則根據(jù)所述第一音符的出現(xiàn)時間確定所述背景音頻中的第一類轉(zhuǎn)折點。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,根據(jù)所述第一音符的出現(xiàn)時間確定的第一類轉(zhuǎn)折點的優(yōu)先級,與所述第一音符的能量與所述第二音符的能量的比值正相關(guān);或者,
根據(jù)所述第一音符的出現(xiàn)時間確定的第一類轉(zhuǎn)折點的優(yōu)先級,與所述第一音符的能量與所述第二音符的能量的差值正相關(guān)。
7.根據(jù)權(quán)利要求2所述的方法,其特征在于,根據(jù)所述背景音頻中的音符的能量,確定所述背景音頻中的轉(zhuǎn)折點,包括:
若所述背景音頻中的第一音頻片段與第二音頻片段的相似度大于第三閾值,則根據(jù)所述第一音頻片段的最后一個音符的出現(xiàn)時間和所述第二音頻片段的最后一個音符的出現(xiàn)時間分別確定所述背景音頻中的第三類轉(zhuǎn)折點。
8.根據(jù)權(quán)利要求7所述的方法,其特征在于,根據(jù)所述第一音頻片段的最后一個音符的出現(xiàn)時間確定的第三類轉(zhuǎn)折點的優(yōu)先級,與所述第一音頻片段與所述第二音頻片段的相似度正相關(guān);根據(jù)所述第二音頻片段的最后一個音符的出現(xiàn)時間確定的第三類轉(zhuǎn)折點的優(yōu)先級,與所述第一音頻片段與所述第二音頻片段的相似度正相關(guān)。
9.根據(jù)權(quán)利要求2所述的方法,其特征在于,根據(jù)所述背景音頻中的音符的能量,確定所述背景音頻中的轉(zhuǎn)折點,包括:
若所述背景音頻中的第一音頻片段的音符的能量的強弱交替現(xiàn)象符合指定的強弱交替模式,則根據(jù)所述第一音頻片段的最后一個音符的出現(xiàn)時間確定所述背景音頻中的第四類轉(zhuǎn)折點。
10.根據(jù)權(quán)利要求9所述的方法,其特征在于,根據(jù)所述第一音頻片段的最后一個音符的出現(xiàn)時間確定的第四類轉(zhuǎn)折點的優(yōu)先級,與所述第一音頻片段的相鄰音符的能量差值正相關(guān)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于阿里巴巴集團控股有限公司,未經(jīng)阿里巴巴集團控股有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910001833.2/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
H04N 圖像通信,如電視
H04N21-00 可選的內(nèi)容分發(fā),例如交互式電視,VOD〔視頻點播〕
H04N21-20 .專門適用于內(nèi)容分發(fā)的專用服務(wù)器,例如:VOD服務(wù)器;其操作
H04N21-40 .專門適用于接收內(nèi)容或者與內(nèi)容交互的客戶端設(shè)備,如STB[機頂盒];相關(guān)操作
H04N21-60 .用于在服務(wù)器和客戶端之間或者在遠程客戶端之間的視頻分配的網(wǎng)絡(luò)結(jié)構(gòu)或者處理
H04N21-80 .通過內(nèi)容產(chǎn)生器獨立于分配過程實現(xiàn)的內(nèi)容或附加數(shù)據(jù)的生成或處理;內(nèi)容本身
H04N21-81 ..其單媒體部件





