[發(fā)明專利]一種視頻編解碼的方法及裝置在審
| 申請?zhí)枺?/td> | 202110080819.3 | 申請日: | 2021-01-21 |
| 公開(公告)號: | CN112887730A | 公開(公告)日: | 2021-06-01 |
| 發(fā)明(設(shè)計)人: | 包佳晶 | 申請(專利權(quán))人: | 百果園技術(shù)(新加坡)有限公司 |
| 主分類號: | H04N19/42 | 分類號: | H04N19/42;H04N21/2343;H04N21/4402 |
| 代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 孟金喆 |
| 地址: | 新加坡巴西班讓路*** | 國省代碼: | 暫無信息 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 視頻 解碼 方法 裝置 | ||
1.一種視頻編碼方法,其特征在于,所述方法包括:
在對目標(biāo)視頻進(jìn)行編碼時,對當(dāng)前待編碼的視頻幀進(jìn)行文字檢測;
若針對所述視頻幀的文字檢測的結(jié)果為存在文字信息,則提取出該視頻幀中的文字信息,并將所述文字信息編碼成文字編碼數(shù)據(jù);
對提取出所述文字信息的視頻幀進(jìn)行去文字處理,生成待編碼視頻幀,并對所述待編碼視頻幀進(jìn)行視頻編碼,生成視頻編碼數(shù)據(jù);
將所述文字編碼數(shù)據(jù)添加到所述視頻編碼數(shù)據(jù)中;
將所述視頻編碼數(shù)據(jù)加入到視頻碼流中進(jìn)行輸出。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對當(dāng)前待編碼的視頻幀進(jìn)行文字檢測,包括:
將當(dāng)前待編碼的視頻幀輸入至已訓(xùn)練的光學(xué)字符識別模型,以通過所述光學(xué)字符識別模型識別出所述視頻幀中是否包含文字信息。
3.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,所述文字信息包括但不限于:文字內(nèi)容、文字樣式信息、文字位置信息。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述對提取出所述文字信息的視頻幀進(jìn)行去文字處理,生成待編碼視頻幀,包括:
根據(jù)所述文字樣式信息以及所述文字位置信息,確定所述文字內(nèi)容所處的區(qū)域;
將所述文字內(nèi)容所處的區(qū)域中的像素的像素值替換為指定像素值,所述指定像素值包括與該區(qū)域相鄰的像素的像素值。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述將所述文字信息編碼成文字編碼數(shù)據(jù),包括:
對所述文字信息進(jìn)行Unicode編碼,生成文字編碼數(shù)據(jù)。
7.一種視頻解碼方法,其特征在于,所述方法包括:
在對視頻碼流進(jìn)行解碼時,判斷當(dāng)前待解碼的視頻編碼數(shù)據(jù)是否攜帶文字編碼數(shù)據(jù);
若當(dāng)前待解碼的視頻編碼數(shù)據(jù)攜帶文字編碼數(shù)據(jù),則對所述文字編碼數(shù)據(jù)進(jìn)行解碼,獲得文字信息;
對所述視頻編碼數(shù)據(jù)進(jìn)行解碼,獲得對應(yīng)的視頻幀;
在所述視頻幀中的對應(yīng)位置添加所述文字信息。
8.根據(jù)權(quán)利要求7所述的方法,其特征在于,所述文字信息包括:文字內(nèi)容、文字樣式信息、文字位置信息;
所述在所述視頻幀中的對應(yīng)位置添加所述文字信息,包括:
在所述視頻幀中定位所述文字位置信息對應(yīng)的位置,并在所述位置中以所述文字樣式信息貼上所述文字內(nèi)容。
9.一種視頻編碼裝置,其特征在于,所述裝置包括:
文字檢測模塊,用于在對目標(biāo)視頻進(jìn)行編碼時,對當(dāng)前待編碼的視頻幀進(jìn)行文字檢測;
文字編碼模塊,用于若針對所述視頻幀的文字檢測的結(jié)果為存在文字信息,則提取出該視頻幀中的文字信息,并將所述文字信息編碼成文字編碼數(shù)據(jù);
去文字處理模塊,用于對提取出所述文字信息的視頻幀進(jìn)行去文字處理,生成待編碼視頻幀;
視頻編碼模塊,用于對所述待編碼視頻幀進(jìn)行視頻編碼,生成視頻編碼數(shù)據(jù);
碼流輸出模塊,用于將所述文字編碼數(shù)據(jù)添加到所述視頻編碼數(shù)據(jù)中,并將所述視頻編碼數(shù)據(jù)加入到視頻碼流中進(jìn)行輸出。
10.一種視頻解碼裝置,其特征在于,所述裝置包括:
判斷模塊,用于在對視頻碼流進(jìn)行解碼時,判斷當(dāng)前待解碼的視頻編碼數(shù)據(jù)是否攜帶文字編碼數(shù)據(jù);
文字解碼模塊,用于若當(dāng)前待解碼的視頻編碼數(shù)據(jù)攜帶文字編碼數(shù)據(jù),則對所述文字編碼數(shù)據(jù)進(jìn)行解碼,獲得文字信息;
視頻解碼模塊,用于對所述視頻編碼數(shù)據(jù)進(jìn)行解碼,獲得對應(yīng)的視頻幀;
文字恢復(fù)模塊,用于在所述視頻幀中的對應(yīng)位置添加所述文字信息。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于百果園技術(shù)(新加坡)有限公司,未經(jīng)百果園技術(shù)(新加坡)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110080819.3/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





