[發(fā)明專利]基于字典學(xué)習(xí)的壓縮感知視頻編解碼系統(tǒng)有效

申請?zhí)枺?/td>	201310589803.0	申請日：	2013-11-20
公開（公告）號：	CN103596010B	公開（公告）日：	2017-01-11
發(fā)明（設(shè)計）人：	郭繼昌;金卯亨嘉;申燊;許穎;孫駿	申請（專利權(quán)）人：	天津大學(xué)
主分類號：	H04N19/177	分類號：	H04N19/177;H04N19/61;H04N19/88
代理公司：	天津市北洋有限責(zé)任專利代理事務(wù)所12201	代理人：	劉國威
地址：	300072***	國省代碼：	天津;12
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	基于字典學(xué)習(xí) 壓縮感知視頻解碼系統(tǒng)
鉆瓜網(wǎng) 技術(shù)展會專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【說明書】：

技術(shù)領(lǐng)域

本發(fā)明涉及視頻壓縮感知和圖像稀疏表示領(lǐng)域，尤其涉及基于字典學(xué)習(xí)的壓縮感知視頻編解碼系統(tǒng)。

背景技術(shù)

本發(fā)明主要針對一些編碼端資源受限的視頻應(yīng)用領(lǐng)域，如視頻監(jiān)控、無線視頻傳感網(wǎng)絡(luò)等。因其使用的設(shè)備和環(huán)境的局限性，此應(yīng)用領(lǐng)域要求低復(fù)雜度、低功耗的編碼端以保證長期穩(wěn)定工作，而接收端可以進行大量的數(shù)據(jù)存儲和復(fù)雜的解碼計算。

然而，無論是H.26X系列還是MPEG系列的傳統(tǒng)視頻編碼技術(shù)，均采用編碼端復(fù)雜、解碼端簡單的系統(tǒng)結(jié)構(gòu)，即編碼端通過幀間預(yù)測、幀內(nèi)預(yù)測和離散余弦變換（DCT）來去除時間和空間冗余，以獲得高壓縮效率，這使得整個系統(tǒng)對編碼器的計算能力和內(nèi)存容量的要求非常高，遠高于解碼器。因此，傳統(tǒng)的視頻編碼方式并不適合于上述領(lǐng)域。

壓縮感知（CS）是近年來信號處理領(lǐng)域誕生的一種新興的理論。該理論在信號獲得的同時對數(shù)據(jù)進行壓縮，其頻率遠低于奈奎斯特采樣頻率，這樣一來可減少采樣的信息數(shù)據(jù)，節(jié)省存儲空間的同時又包含有足夠的信息。在需要恢復(fù)原始信號時，采用合適的重構(gòu)算法進行還原，從而恢復(fù)出足量數(shù)據(jù)。壓縮感知理論將傳統(tǒng)的數(shù)據(jù)采集和壓縮合二為一，不需要復(fù)雜的數(shù)據(jù)編碼計算，非常適合采用于編碼端資源受限的場合。

發(fā)明內(nèi)容

本發(fā)明旨在解決克服現(xiàn)有技術(shù)的不足，設(shè)計一個針對無線視頻傳感網(wǎng)絡(luò)的壓縮感知視頻編解碼系統(tǒng)，使其具有編碼端復(fù)雜度低和計算量小，信道傳輸數(shù)據(jù)量少，解碼端能夠進行高質(zhì)量實時視頻重構(gòu)等特點。為此，本發(fā)明采用的技術(shù)方案是，基于字典學(xué)習(xí)的壓縮感知視頻編解碼系統(tǒng)，主要包括視頻編碼端和解碼端兩部分：

編碼端：根據(jù)重構(gòu)精度和實時性的要求，視頻中的幀將被分為兩類，一類為關(guān)鍵幀(K幀)，另一類為非關(guān)鍵幀（CS幀），每兩幀組成一個小組，即圖像組（GOP）為2，奇數(shù)幀為K幀，緊隨其后的為該組的CS幀；針對K幀，根據(jù)壓縮感知理論，將K幀的圖像像素數(shù)據(jù)進行臨時存儲，然后通過觀測矩陣Φ進行降維，將降維后的數(shù)據(jù)通過無線發(fā)射模塊傳輸給解碼端；針對CS幀，在讀入圖像像素數(shù)據(jù)后，與前一幀K幀進行差分，即dv=Xcs-Xk，并判斷dv的均方誤差值（MSE），若MSE小于閾值下限，則判定這兩幀非常相似，發(fā)送一個1bit信號通知解碼端該CS幀無需重構(gòu)，直接使用前一幀K幀重構(gòu)結(jié)果作為其重構(gòu)結(jié)果；若MSE大于閾值上限，將dv通過觀測矩陣Φ降維，將降維后的數(shù)據(jù)發(fā)送給解碼端，同時發(fā)送1bit信號通知解碼端在完成此CS幀重構(gòu)后進行字典學(xué)習(xí)；若MSE在閾值范圍內(nèi)，則直接將dv通過觀測矩陣Φ降維并發(fā)送；

在解碼端，K幀經(jīng)過壓縮感知重構(gòu)算法即改進型的修正牛頓法（NSL0）解碼出來并儲存，如果編碼端傳來更新字典的信號，則根據(jù)K-奇異值分解算法(K-SVD)進行稀疏矩陣的字典更新；對于CS幀，使用K幀更新過的系數(shù)矩陣和觀測矩陣進行NSL0壓縮重構(gòu)，將重構(gòu)出的結(jié)果與前一幀K幀的重構(gòu)結(jié)果相加得到CS幀的重構(gòu)，最后按照幀序整合成視頻并輸出。

觀測矩陣使用分塊的高斯隨機矩陣。

壓縮感知理論具體是指，采用K-SVD字典學(xué)習(xí)法生成稀疏字典，初始的稀疏字典設(shè)定為全局字典，即使用攝像頭所處場景的圖片訓(xùn)練出來的字典。

本發(fā)明的技術(shù)特點及效果：

本發(fā)明采用壓縮感知進行使用無線視頻傳感網(wǎng)絡(luò)的編解碼，將計算復(fù)雜度從編碼端移到了解碼端。

使用差分分離法和基于塊的觀測矩陣，在保證重構(gòu)精度的前提下，有效降低了CS幀的傳輸數(shù)據(jù)量和重構(gòu)時間。

使用全局字典作為初始字典，并通過字典學(xué)習(xí)定時更新字典，在不影響視頻重構(gòu)實時性的前提下，有效提高重構(gòu)精度。

附圖說明

圖1本發(fā)明的硬件結(jié)構(gòu)圖。

圖2本發(fā)明的基于字典學(xué)習(xí)的壓縮感知視頻編解碼系統(tǒng)框圖。

圖3本發(fā)明中的字典學(xué)習(xí)算法流程圖。

具體實施方式

為了達到上述目的，本發(fā)明采用基于字典學(xué)習(xí)的壓縮感知完成整個視頻編解碼系統(tǒng)。主要包括視頻編碼端和解碼端兩部分。

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于天津大學(xué)，未經(jīng)天津大學(xué)許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201310589803.0/2.html，轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

上一篇：自由基固化組合物的方法
下一篇：一種1，12-亞氨基苯并[c]菲類化合物、中間體及制備方法和應(yīng)用

同類專利

專利分類

H 電學(xué)

H04 電通信技術(shù)
H04N 圖像通信，如電視

免登錄下載普通用戶下載升級VIP會員，免費下載

[發(fā)明專利]基于字典學(xué)習(xí)的壓縮感知視頻編解碼系統(tǒng)有效

專利文獻下載