[發(fā)明專利]多媒體數(shù)據(jù)分割方法和裝置在審
| 申請?zhí)枺?/td> | 201710677389.7 | 申請日: | 2017-08-09 |
| 公開(公告)號: | CN107623860A | 公開(公告)日: | 2018-01-23 |
| 發(fā)明(設(shè)計)人: | 李冠楠 | 申請(專利權(quán))人: | 北京奇藝世紀(jì)科技有限公司 |
| 主分類號: | H04N21/234 | 分類號: | H04N21/234;H04N21/233;H04N21/44;H04N21/439;G11B27/031;G11B27/10 |
| 代理公司: | 北京潤澤恒知識產(chǎn)權(quán)代理有限公司11319 | 代理人: | 莎日娜 |
| 地址: | 100080 北京市海淀*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 多媒體 數(shù)據(jù) 分割 方法 裝置 | ||
1.一種多媒體數(shù)據(jù)分割方法,其特征在于,包括:
從待分割的多媒體數(shù)據(jù)中提取音頻數(shù)據(jù)和視頻數(shù)據(jù);
將所述音頻數(shù)據(jù)劃分為靜音片段和非靜音片段,將相鄰的所述靜音片段與所述非靜音片段之間的臨界時刻確定為音頻分割點;
將所述視頻數(shù)據(jù)劃分為視頻片段,將相鄰的所述視頻片段之間的臨界時刻確定為視頻分割點;
根據(jù)所述音頻分割點和所述視頻分割點,對所述多媒體數(shù)據(jù)進行分割,得到多媒體數(shù)據(jù)段。
2.根據(jù)權(quán)利要求1所述的多媒體數(shù)據(jù)分割方法,其特征在于,所述將所述音頻數(shù)據(jù)劃分為靜音片段和非靜音片段包括:
將所述音頻數(shù)據(jù)劃分為音頻處理單元;
檢測所述音頻處理單元的音頻類型,所述音頻類型包括靜音類型和非靜音類型;
根據(jù)所述音頻類型,對劃分的音頻處理單元進行合并,得到所述靜音片段和所述非靜音片段。
3.根據(jù)權(quán)利要求2所述的多媒體數(shù)據(jù)分割方法,其特征在于,所述檢測所述音頻處理單元的音頻類型包括:
確定所述音頻處理單元的均方根值;
如果所述均方根值小于絕對靜音閾值,確定所述音頻處理單元的音頻類型為靜音類型;
如果所述均方根值大于或等于所述絕對靜音閾值,確定所述音頻處理單元的音頻類型為非靜音類型。
4.根據(jù)權(quán)利要求2所述的多媒體數(shù)據(jù)分割方法,其特征在于,所述檢測所述音頻處理單元的音頻類型包括:
確定所述音頻處理單元的均方根值;
如果所述均方根值小于相對靜音閾值與特定值之差,確定所述音頻處理單元的音頻類型為靜音類型;
如果所述均方根值大于或等于所述相對靜音閾值與所述特定值之差,確定所述音頻處理單元的音頻類型為非靜音類型;
其中,所述相對靜音閾值為均方根值隊列中包括的均方根值的平均值,所述均方根值隊列中包括的均方根值為在所述音頻處理單元之前連續(xù)的音頻處理單元的均方根值。
5.根據(jù)權(quán)利要求4所述的多媒體數(shù)據(jù)分割方法,其特征在于,在所述確定所述音頻處理單元的均方根值之后,還包括:
判定所述均方根值隊列中包括的均方根值的數(shù)目大于或等于第一預(yù)設(shè)數(shù)目;
將所述均方根值隊列中頭部的均方根值刪除;
將所述音頻處理單元的均方根值添加至所述均方根值隊列的尾部。
6.根據(jù)權(quán)利要求2所述的多媒體數(shù)據(jù)分割方法,其特征在于,所述根據(jù)所述音頻類型,對劃分的音頻處理單元進行合并包括:
判定連續(xù)的音頻處理單元的音頻類型相同;
將連續(xù)的音頻處理單元順次合并。
7.根據(jù)權(quán)利要求6所述的多媒體數(shù)據(jù)分割方法,其特征在于,在所述將連續(xù)的音頻處理單元順次合并之后,還包括:
判定所述靜音片段的音頻時長小于第一預(yù)設(shè)時長;
將所述靜音片段重置為所述非靜音片段。
8.根據(jù)權(quán)利要求1所述的多媒體數(shù)據(jù)分割方法,其特征在于,所述根據(jù)所述音頻分割點和所述視頻分割點,對所述多媒體數(shù)據(jù)進行分割包括:
根據(jù)所述音頻分割點判斷所述視頻分割點是否可用;
如果所述視頻分割點可用,根據(jù)所述視頻分割點對所述多媒體數(shù)據(jù)進行分割。
9.根據(jù)權(quán)利要求8所述的多媒體數(shù)據(jù)分割方法,其特征在于,所述根據(jù)所述音頻分割點判斷所述視頻分割點是否可用包括:
如果所述視頻分割點處于對應(yīng)所述靜音片段的頭分割點和尾分割點之間,確定所述視頻分割點可用,其中,所述靜音片段的頭分割點為與所述靜音片段對應(yīng)的兩個音頻分割點中時刻靠前的音頻分割點,所述靜音片段的尾分割點為與所述靜音片段對應(yīng)的兩個音頻分割點中時刻靠后的音頻分割點。
10.根據(jù)權(quán)利要求8所述的多媒體數(shù)據(jù)分割方法,其特征在于,所述視頻片段包括鏡頭畫面,所述鏡頭畫面包括畫面幀,所述根據(jù)所述音頻分割點判斷所述視頻分割點是否可用包括:
如果在以所述視頻分割點為起點之后的第二預(yù)設(shè)數(shù)目的畫面幀中存在所述靜音片段的頭分割點,確定所述視頻分割點可用;或,
如果在以所述視頻分割點為起點之前的第三預(yù)設(shè)數(shù)目的畫面幀中存在所述靜音片段的尾分割點,確定所述視頻分割點可用。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京奇藝世紀(jì)科技有限公司,未經(jīng)北京奇藝世紀(jì)科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710677389.7/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
H04N 圖像通信,如電視
H04N21-00 可選的內(nèi)容分發(fā),例如交互式電視,VOD〔視頻點播〕
H04N21-20 .專門適用于內(nèi)容分發(fā)的專用服務(wù)器,例如:VOD服務(wù)器;其操作
H04N21-40 .專門適用于接收內(nèi)容或者與內(nèi)容交互的客戶端設(shè)備,如STB[機頂盒];相關(guān)操作
H04N21-60 .用于在服務(wù)器和客戶端之間或者在遠程客戶端之間的視頻分配的網(wǎng)絡(luò)結(jié)構(gòu)或者處理
H04N21-80 .通過內(nèi)容產(chǎn)生器獨立于分配過程實現(xiàn)的內(nèi)容或附加數(shù)據(jù)的生成或處理;內(nèi)容本身
H04N21-81 ..其單媒體部件
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





