[發明專利]基于多尺度在線字典學習的可分級視頻編碼系統在審
| 申請號: | 201410331199.6 | 申請日: | 2014-07-11 |
| 公開(公告)號: | CN104199627A | 公開(公告)日: | 2014-12-10 |
| 發明(設計)人: | 熊紅凱;唐欣 | 申請(專利權)人: | 上海交通大學 |
| 主分類號: | G06F3/14 | 分類號: | G06F3/14 |
| 代理公司: | 上海漢聲知識產權代理有限公司 31236 | 代理人: | 郭國中 |
| 地址: | 200240 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 尺度 在線 字典 學習 分級 視頻 編碼 系統 | ||
1.一種基于多尺度在線字典學習的可分級視頻編碼系統,其特征在于所述系統包括:基于層次化稀疏的多尺度訓練集構造模塊、在線字典學習模塊以及跨尺度視頻幀重構模塊,其中:
所述基于層次化稀疏的多尺度訓練集構造模塊利用多級小波變換獲得圖像不同尺度上的層次化稀疏結構,通過高斯差分濾波器組提取方向能量獲得圖像中的基元區域,截取基元區域的圖像塊生成多尺度訓練集;
所述在線字典學習模塊利用隨機梯度下降法保證了在低復雜度下迭代優化字典原子,通過在線字典學習算法對不同尺度的訓練集進行字典學習,生成對應的多尺度子字典基;
所述跨尺度視頻幀重構模塊對低頻視頻幀通過構造的子字典基學習到不同層次的丟失高頻信息,通過不同級數的小波逆變換重構,實現視頻質量可分級的目的。
2.根據權利要求1所述的一種基于多尺度在線字典學習的可分級視頻編碼系統,其特征在于,所述的基于層次化稀疏的多尺度訓練集構造模塊實現由在重構的關鍵幀上通過K階小波變換得到圖片的低頻子帶和3個方向上的K-1階高頻子帶,對于每一個子帶通過高斯濾波器進行基元塊的提取和方向分類,不同尺度的每個方向類中的基元塊對應于一個子訓練集,同時在子訓練集上訓練得到的字典基上具有層次化稀疏結構。
3.根據權利要求2所述的一種基于多尺度在線字典學習的可分級視頻編碼系統,其特征在于,所述的基于小波變換的多尺度訓練集構造通過小波變換、基元塊提取和分類方法對整個重構關鍵幀進行操作來實現。
4.根據權利要求1-3任一項所述的一種基于多尺度在線字典學習的可分級視頻編碼系統,其特征在于,所述的在線字典學習模塊實現由隨機梯度下降法實現稀疏表示誤差的最小化,它能夠適應性的表示出高維信號的內在結構,相對于固定基能更有效地稀疏表示視頻信號,這種在過完備學習字典基矩陣上的稀疏表示是具有結構化稀疏的。
5.根據權利要求4所述的一種基于多尺度在線字典學習的可分級視頻編碼系統,其特征在于,所述的在線字典學習模塊能夠在每一次迭代中僅基于當前訓練塊最小化代價函數,單獨作用于不同的子訓練集組得到不同的子字典對。
6.根據權利要求1-3任一項所述的一種基于多尺度在線字典學習的可分級視頻編碼系統,其特征在于,所述的跨尺度視頻幀重構模塊通過一種凸松弛算法模型實現的,找到的最優的稀疏表示稀疏乘以對應子字典基,通過不同階數的小波逆變換就是要得到可分級的重構信號。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海交通大學;,未經上海交通大學;許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410331199.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種還原界面內容的方法及裝置
- 下一篇:一種移動終端的信息輸入方法及設備





