[發(fā)明專利]基于字典學(xué)習(xí)的壓縮感知視頻編解碼系統(tǒng)有效
| 申請?zhí)枺?/td> | 201310589803.0 | 申請日: | 2013-11-20 |
| 公開(公告)號: | CN103596010B | 公開(公告)日: | 2017-01-11 |
| 發(fā)明(設(shè)計)人: | 郭繼昌;金卯亨嘉;申燊;許穎;孫駿 | 申請(專利權(quán))人: | 天津大學(xué) |
| 主分類號: | H04N19/177 | 分類號: | H04N19/177;H04N19/61;H04N19/88 |
| 代理公司: | 天津市北洋有限責(zé)任專利代理事務(wù)所12201 | 代理人: | 劉國威 |
| 地址: | 300072*** | 國省代碼: | 天津;12 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 字典 學(xué)習(xí) 壓縮 感知 視頻 解碼 系統(tǒng) | ||
技術(shù)領(lǐng)域
本發(fā)明涉及視頻壓縮感知和圖像稀疏表示領(lǐng)域,尤其涉及基于字典學(xué)習(xí)的壓縮感知視頻編解碼系統(tǒng)。
背景技術(shù)
本發(fā)明主要針對一些編碼端資源受限的視頻應(yīng)用領(lǐng)域,如視頻監(jiān)控、無線視頻傳感網(wǎng)絡(luò)等。因其使用的設(shè)備和環(huán)境的局限性,此應(yīng)用領(lǐng)域要求低復(fù)雜度、低功耗的編碼端以保證長期穩(wěn)定工作,而接收端可以進行大量的數(shù)據(jù)存儲和復(fù)雜的解碼計算。
然而,無論是H.26X系列還是MPEG系列的傳統(tǒng)視頻編碼技術(shù),均采用編碼端復(fù)雜、解碼端簡單的系統(tǒng)結(jié)構(gòu),即編碼端通過幀間預(yù)測、幀內(nèi)預(yù)測和離散余弦變換(DCT)來去除時間和空間冗余,以獲得高壓縮效率,這使得整個系統(tǒng)對編碼器的計算能力和內(nèi)存容量的要求非常高,遠高于解碼器。因此,傳統(tǒng)的視頻編碼方式并不適合于上述領(lǐng)域。
壓縮感知(CS)是近年來信號處理領(lǐng)域誕生的一種新興的理論。該理論在信號獲得的同時對數(shù)據(jù)進行壓縮,其頻率遠低于奈奎斯特采樣頻率,這樣一來可減少采樣的信息數(shù)據(jù),節(jié)省存儲空間的同時又包含有足夠的信息。在需要恢復(fù)原始信號時,采用合適的重構(gòu)算法進行還原,從而恢復(fù)出足量數(shù)據(jù)。壓縮感知理論將傳統(tǒng)的數(shù)據(jù)采集和壓縮合二為一,不需要復(fù)雜的數(shù)據(jù)編碼計算,非常適合采用于編碼端資源受限的場合。
發(fā)明內(nèi)容
本發(fā)明旨在解決克服現(xiàn)有技術(shù)的不足,設(shè)計一個針對無線視頻傳感網(wǎng)絡(luò)的壓縮感知視頻編解碼系統(tǒng),使其具有編碼端復(fù)雜度低和計算量小,信道傳輸數(shù)據(jù)量少,解碼端能夠進行高質(zhì)量實時視頻重構(gòu)等特點。為此,本發(fā)明采用的技術(shù)方案是,基于字典學(xué)習(xí)的壓縮感知視頻編解碼系統(tǒng),主要包括視頻編碼端和解碼端兩部分:
編碼端:根據(jù)重構(gòu)精度和實時性的要求,視頻中的幀將被分為兩類,一類為關(guān)鍵幀(K幀),另一類為非關(guān)鍵幀(CS幀),每兩幀組成一個小組,即圖像組(GOP)為2,奇數(shù)幀為K幀,緊隨其后的為該組的CS幀;針對K幀,根據(jù)壓縮感知理論,將K幀的圖像像素數(shù)據(jù)進行臨時存儲,然后通過觀測矩陣Φ進行降維,將降維后的數(shù)據(jù)通過無線發(fā)射模塊傳輸給解碼端;針對CS幀,在讀入圖像像素數(shù)據(jù)后,與前一幀K幀進行差分,即dv=Xcs-Xk,并判斷dv的均方誤差值(MSE),若MSE小于閾值下限,則判定這兩幀非常相似,發(fā)送一個1bit信號通知解碼端該CS幀無需重構(gòu),直接使用前一幀K幀重構(gòu)結(jié)果作為其重構(gòu)結(jié)果;若MSE大于閾值上限,將dv通過觀測矩陣Φ降維,將降維后的數(shù)據(jù)發(fā)送給解碼端,同時發(fā)送1bit信號通知解碼端在完成此CS幀重構(gòu)后進行字典學(xué)習(xí);若MSE在閾值范圍內(nèi),則直接將dv通過觀測矩陣Φ降維并發(fā)送;
在解碼端,K幀經(jīng)過壓縮感知重構(gòu)算法即改進型的修正牛頓法(NSL0)解碼出來并儲存,如果編碼端傳來更新字典的信號,則根據(jù)K-奇異值分解算法(K-SVD)進行稀疏矩陣的字典更新;對于CS幀,使用K幀更新過的系數(shù)矩陣和觀測矩陣進行NSL0壓縮重構(gòu),將重構(gòu)出的結(jié)果與前一幀K幀的重構(gòu)結(jié)果相加得到CS幀的重構(gòu),最后按照幀序整合成視頻并輸出。
觀測矩陣使用分塊的高斯隨機矩陣。
壓縮感知理論具體是指,采用K-SVD字典學(xué)習(xí)法生成稀疏字典,初始的稀疏字典設(shè)定為全局字典,即使用攝像頭所處場景的圖片訓(xùn)練出來的字典。
本發(fā)明的技術(shù)特點及效果:
本發(fā)明采用壓縮感知進行使用無線視頻傳感網(wǎng)絡(luò)的編解碼,將計算復(fù)雜度從編碼端移到了解碼端。
使用差分分離法和基于塊的觀測矩陣,在保證重構(gòu)精度的前提下,有效降低了CS幀的傳輸數(shù)據(jù)量和重構(gòu)時間。
使用全局字典作為初始字典,并通過字典學(xué)習(xí)定時更新字典,在不影響視頻重構(gòu)實時性的前提下,有效提高重構(gòu)精度。
附圖說明
圖1本發(fā)明的硬件結(jié)構(gòu)圖。
圖2本發(fā)明的基于字典學(xué)習(xí)的壓縮感知視頻編解碼系統(tǒng)框圖。
圖3本發(fā)明中的字典學(xué)習(xí)算法流程圖。
具體實施方式
為了達到上述目的,本發(fā)明采用基于字典學(xué)習(xí)的壓縮感知完成整個視頻編解碼系統(tǒng)。主要包括視頻編碼端和解碼端兩部分。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于天津大學(xué),未經(jīng)天津大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310589803.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 一種電子字典數(shù)據(jù)更新系統(tǒng)及其方法
- 一種階梯字典
- 一種基于網(wǎng)絡(luò)字典的無損數(shù)據(jù)壓縮方法
- 數(shù)據(jù)冗余消除DRE字典確認方法和設(shè)備
- 一種對字典和字典項進行處理的方法及服務(wù)器
- 一種數(shù)據(jù)字典的處理方法、裝置、存儲介質(zhì)及處理器
- 一種基于深度矩陣字典的字典學(xué)習(xí)方法
- 一種字典轉(zhuǎn)碼方法、裝置、存儲介質(zhì)及終端
- 一種基于不相干性聯(lián)合字典學(xué)習(xí)的圖像分類方法
- 一種基于Kubernetes容器配置字典和保密字典的實現(xiàn)方法及其系統(tǒng)
- 根據(jù)用戶學(xué)習(xí)效果動態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個人化學(xué)習(xí)服務(wù)的方法
- 漸進式學(xué)習(xí)管理方法及漸進式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲介質(zhì)
- 基于強化學(xué)習(xí)的自適應(yīng)移動學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲介質(zhì)
- 游戲?qū)W習(xí)效果評測方法及系統(tǒng)





