[發明專利]一種視頻剪輯方法和剪輯系統有效
| 申請號: | 201810277976.1 | 申請日: | 2018-03-31 |
| 公開(公告)號: | CN108259965B | 公開(公告)日: | 2020-05-12 |
| 發明(設計)人: | 牛嵩峰;周曉民;唐煒 | 申請(專利權)人: | 湖南廣播電視臺廣播傳媒中心 |
| 主分類號: | H04N21/43 | 分類號: | H04N21/43;H04N21/8547;H04N21/44;H04N21/439;H04N21/435 |
| 代理公司: | 長沙市融智專利事務所(普通合伙) 43114 | 代理人: | 顏勇 |
| 地址: | 410000 湖南省長沙市開福區三*** | 國省代碼: | 湖南;43 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 視頻剪輯 方法 剪輯 系統 | ||
1.一種視頻剪輯方法,其特征在于:包括如下步驟:
步驟1:解碼視頻文件并進行音視頻分離得到畫面幀數據、音頻幀數據以及畫面幀和音頻幀的同步表;
其中,所述畫面幀和音頻幀的同步表包括每個音頻幀與音頻時長、畫面幀以及視頻時長的對應關系,所述音頻幀數據以時間為橫軸坐標、幅度為縱軸坐標的音頻波,所述音頻波上分布離散采樣點;
步驟2:將音頻數據同步翻譯為文字;
步驟3:獲取音頻中每個音節的起始時刻、終止時刻以及底噪或靜音區,并構建文字與音頻中音節的同步時間戳;
其中,所述同步時間戳包括每個文字與對應音節在起始時刻、終止時刻、底噪或靜音區的標記編號;
步驟4:在剪輯窗口剪輯文字或者音頻,再依據所述畫面幀和音頻幀的同步表,所述同步時間戳同步剪輯畫面幀數據、音頻幀數據或者同步剪輯畫面幀數據和文字;
a:在剪輯窗口剪輯文字時,依據所述同步時間戳獲取所選定的文字對應在音頻中的標記編號,再根據所述標記編號獲取音頻剪輯范圍,然后再依據所述畫面幀和音頻幀的同步表判斷所述音頻剪輯范圍內是否存在對應的畫面幀,若存在,所述音頻剪輯范圍內對應的畫面幀為待剪輯的畫面幀;
b:在剪輯窗口剪輯音頻時,獲取音頻剪輯范圍,再依據所述同步時間戳獲取文字剪輯范圍,以及依據所述畫面幀和音頻幀的同步表判斷所述音頻剪輯范圍內是否存在對應的畫面幀,若存在,所述音頻剪輯范圍內對應的畫面幀為待剪輯的畫面幀;
步驟5:將剪輯后的畫面幀數據、音頻幀數據以及文字進行封裝導出。
2.根據權利要求1所述的方法,其特征在于:步驟3中所述構建文字與音頻中音節的同步時間戳的過程如下:
S1:將所述音頻波進行區間劃分;
其中,每個區間包括x個采樣點,音頻波的采樣頻率低于或等于48kHz,x的取值范圍為50-150,音頻波的采樣頻率為96kHz或88.2kHz,x的取值范圍為100-300,音頻波的采樣頻率為192kHz,x的取值范圍為200-600;
S2:計算每個區間的平均相對電平值;
其中,區間的平均相對電平值計算公式如下:
X=0000,0000,0000,0001
式中,表示第n個區間的平均相對電平值,分別表示第n個區間中第1、2、x個采樣點的幅度的絕對值,X表示量化比特數為16位的預設的取樣信號,n為正整數;
S3:依據每個區間的平均相對電平值獲取每個區間的節點識別參數;
其中,所述節點識別參數包括電平參數和電平變化參數:
式中,表示第n個區間的電平參數,表示第n個區間的電平變化參數;
S4:依據每個區間的節點識別參數以及預設的節點識別標準獲取音頻中每個音節起始時刻、終止時刻以及底噪或靜音區,并依次進行標記編號;
其中,一個音節的終止時刻至后一相鄰音節的起始時刻為音節的底噪或靜音區;
S5:依據步驟1中的文字以及步驟5中標記編號構建文字與語音中音節的時刻同步表,得到文字與語音的同步時間戳;
其中,所述同步時間戳是所述同步表中每個文字與對應音節在起始時刻、終止時刻、底噪或靜音區的標記編號。
3.根據權利要求2所述的方法,其特征在于:所述預設的節點識別標準為:
A:若連續α個區間的電平參數和電平變化參數均滿足則表示滿足的所述α個區間內存在底噪或靜音區的起始時刻;
B:若區間的電平參數和電平變化參數滿足且隨后相鄰的α-1個區間的電平變化參數均大于1dB,則表示滿足的所述區間內存在一個音節的起始時刻;
C:若連續α-2個區間的電平參數和電平變化參數均滿足則表示滿足的所述α-2個區間內存在音節的高潮處時刻;
D:若區間的電平參數和電平變化參數均滿足且隨后相鄰的α-1個區間的電平變化參數均小于-1dB,則表示音節的幅度下降;
E:若連續α個區間的電平參數和電平變化參數均滿足則表示滿足的所述α個區間內存在音節終止時刻;
其中,3≤α≤7。
4.根據權利要求3所述的方法,其特征在于:構建所述同步時間戳后還包括識別音頻中是否時長超過5s的底噪或靜音區,若存在,在文字中針對所述超過5s的底噪或靜音區的對應位置進行留白或者標記。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于湖南廣播電視臺廣播傳媒中心,未經湖南廣播電視臺廣播傳媒中心許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810277976.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種TV端播放器
- 下一篇:一種基于GPS授時的多媒體大屏同步播放方法





