[發(fā)明專利]一種音視頻處理方法和裝置有效
申請?zhí)枺?/td> | 201610363573.X | 申請日: | 2016-05-27 |
公開(公告)號: | CN107438181B | 公開(公告)日: | 2019-12-06 |
發(fā)明(設(shè)計)人: | 邢迪;劉清波 | 申請(專利權(quán))人: | 貳陸陸(深圳)游戲開發(fā)有限公司 |
主分類號: | H04N19/176 | 分類號: | H04N19/176;H04N19/13;H04N19/186;G10L21/0208 |
代理公司: | 11463 北京超凡宏宇專利代理事務(wù)所(特殊普通合伙) | 代理人: | 徐麗<國際申請>=<國際公布>=<進(jìn)入國 |
地址: | 518000 廣東省深圳市南山區(qū)西麗街道*** | 國省代碼: | 廣東;44 |
權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
摘要: | |||
搜索關(guān)鍵詞: | 一種 視頻 處理 方法 裝置 | ||
1.一種音視頻處理方法,其特征在于,包括以下步驟:
從編碼后的視頻數(shù)據(jù)中獲取待解碼視頻數(shù)據(jù);
從所述待解碼視頻數(shù)據(jù)中獲取編碼表;
根據(jù)檢索頻率將所述編碼表分割為預(yù)定數(shù)目的子碼塊;所述檢索頻率是指拖尾系數(shù)個數(shù)和非零系數(shù)個數(shù)在解碼中出現(xiàn)的次數(shù)概率;其中,所述根據(jù)檢索頻率將所述編碼表分割為預(yù)定數(shù)目的子碼塊,包括:根據(jù)拖尾系數(shù)個數(shù)和非零系數(shù)個數(shù)各自出現(xiàn)頻率的高低來對所述編碼表進(jìn)行分割,頻率高的進(jìn)行小塊分割,頻率低的進(jìn)行大塊分割;
根據(jù)上下文獲取當(dāng)前塊值;所述當(dāng)前塊值是通過所述編碼表的上下文將原編碼矩陣分割成預(yù)定數(shù)目的子碼塊后,相鄰兩個碼塊之間的非零系數(shù)個數(shù)來計算出來的;
根據(jù)所述當(dāng)前塊值和所述子碼塊動態(tài)生成所述待解碼視頻數(shù)據(jù)的數(shù)據(jù)長度值;
根據(jù)所述數(shù)據(jù)長度值對所述待解碼視頻數(shù)據(jù)進(jìn)行CAVLC解碼,以獲取解碼后的YUV格式的視頻數(shù)據(jù)。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,還包括:將所述解碼后的YUV格式的視頻數(shù)據(jù)轉(zhuǎn)換為RGB格式的貼圖,并在固定位置以預(yù)定頻率顯示所述貼圖,其中,所述將所述解碼后的YUV格式的視頻數(shù)據(jù)轉(zhuǎn)換為RGB格式的貼圖的步驟包括:
將每個像素點的浮點型YUV分量數(shù)據(jù)轉(zhuǎn)換成整型YUV分量數(shù)據(jù);
根據(jù)所述整型YUV分量數(shù)據(jù)計算當(dāng)前像素點的R、G、B三個顏色通道的偏移值;
分別將所述R、G、B三個顏色通道的偏移值進(jìn)行移位運算,獲取移位后的R、G、B三個顏色通道的偏移值;
分別將所述移位后的R、G、B三個顏色通道的偏移值和RGB基準(zhǔn)色值進(jìn)行線性運算,獲取R、G、B三個顏色通道值。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,在所述從編碼后的視頻數(shù)據(jù)中獲取待解碼視頻數(shù)據(jù)的步驟之前還包括:
采集音頻數(shù)據(jù)和視頻數(shù)據(jù);
對所述音頻數(shù)據(jù)進(jìn)行編碼,獲取編碼后的音頻數(shù)據(jù),對所述視頻數(shù)據(jù)進(jìn)行編碼,獲取所述編碼后的視頻數(shù)據(jù);
發(fā)送所述編碼后的音頻數(shù)據(jù)和視頻數(shù)據(jù)。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,在所述對所述音頻數(shù)據(jù)進(jìn)行編碼的步驟之前,還包括:
對所述音頻數(shù)據(jù)進(jìn)行回音消除,獲取回聲消除后的音頻數(shù)據(jù);
對所述回聲消除后的音頻數(shù)據(jù)進(jìn)行靜音檢測,以獲取濾除靜音數(shù)據(jù)幀的音頻數(shù)據(jù);
對所述濾除靜音數(shù)據(jù)幀的音頻數(shù)據(jù)進(jìn)行降噪處理,以獲取濾除背景噪音后的音頻數(shù)據(jù)。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述對所述音頻數(shù)據(jù)進(jìn)行回音消除的步驟包括:
計算所述音頻數(shù)據(jù)的聲音延遲時間;
根據(jù)所述聲音延遲時間對所述音頻數(shù)據(jù)進(jìn)行回聲消除,以獲取回聲消除后的音頻數(shù)據(jù)。
6.一種音視頻處理裝置,其特征在于,包括:
待解碼視頻數(shù)據(jù)獲取模塊,從編碼后的視頻數(shù)據(jù)中獲取待解碼視頻數(shù)據(jù);
編碼表獲取模塊,用于從所述待解碼視頻數(shù)據(jù)中獲取編碼表;
分割模塊,用于根據(jù)檢索頻率將所述編碼表分割為預(yù)定數(shù)目的子碼塊;所述檢索頻率是指拖尾系數(shù)個數(shù)和非零系數(shù)個數(shù)在解碼中出現(xiàn)的次數(shù)概率;其中,所述根據(jù)檢索頻率將所述編碼表分割為預(yù)定數(shù)目的子碼塊,包括:根據(jù)拖尾系數(shù)個數(shù)和非零系數(shù)個數(shù)各自出現(xiàn)頻率的高低來對所述編碼表進(jìn)行分割,頻率高的進(jìn)行小塊分割,頻率低的進(jìn)行大塊分割;
當(dāng)前塊值計算模塊,用于根據(jù)上下文獲取當(dāng)前塊值;所述當(dāng)前塊值是通過所述編碼表的上下文將原編碼矩陣分割成預(yù)定數(shù)目的子碼塊后,相鄰兩個碼塊之間的非零系數(shù)個數(shù)來計算出來的;
數(shù)據(jù)長度值計算模塊,用于根據(jù)所述當(dāng)前塊值和所述子碼塊動態(tài)生成所述待解碼視頻數(shù)據(jù)的數(shù)據(jù)長度值;
視頻解碼模塊,用于根據(jù)所述數(shù)據(jù)長度值對所述待解碼視頻數(shù)據(jù)進(jìn)行CAVLC解碼,以獲取解碼后的YUV格式的視頻數(shù)據(jù)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于貳陸陸(深圳)游戲開發(fā)有限公司,未經(jīng)貳陸陸(深圳)游戲開發(fā)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610363573.X/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。