[發(fā)明專利]用于圖像重構(gòu)的二步學(xué)習(xí)矢量量化碼書生成方法有效
| 申請?zhí)枺?/td> | 201210151874.8 | 申請日: | 2012-05-16 |
| 公開(公告)號: | CN102740072A | 公開(公告)日: | 2012-10-17 |
| 發(fā)明(設(shè)計(jì))人: | 劉若辰;陳超;張偉;焦李成;劉靜;馬文萍;李陽陽;馬晶晶 | 申請(專利權(quán))人: | 西安電子科技大學(xué) |
| 主分類號: | H04N7/26 | 分類號: | H04N7/26 |
| 代理公司: | 陜西電子工業(yè)專利中心 61205 | 代理人: | 王品華;朱紅星 |
| 地址: | 710071*** | 國省代碼: | 陜西;61 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 用于 圖像 學(xué)習(xí) 矢量 量化 書生 成方 | ||
技術(shù)領(lǐng)域
本發(fā)明屬于數(shù)字圖像壓縮編碼領(lǐng)域,涉及圖像壓縮重構(gòu),具體是一種用于圖像重構(gòu)的二步學(xué)習(xí)矢量量化碼書生成方法。該方法可應(yīng)用于數(shù)字通信和多媒體傳輸中,實(shí)現(xiàn)以較小代價(jià)傳輸高質(zhì)量圖像。
背景技術(shù)
隨著人們對數(shù)字化多媒體信息需求的與日俱增,圖像壓縮己成為信息傳輸領(lǐng)域中的一項(xiàng)關(guān)鍵技術(shù)。圖像壓縮的目的就是要盡可能地減少表示圖像所需的數(shù)據(jù)量。矢量量化作為一種有效的有損壓縮技術(shù),具有壓縮比大、編解碼簡單的優(yōu)點(diǎn),是Shannon信息論在信源編碼理論方面的新發(fā)展。目前,在基于內(nèi)容的圖像檢索領(lǐng)域和超譜圖像壓縮領(lǐng)域中,矢量量化是一種非常有效的技術(shù)。
矢量量化的基本原理是用碼書中與輸入矢量之間失真誤差最小的碼字的索引來代替輸入矢量進(jìn)行存儲和傳輸,而在解碼端只需進(jìn)行簡單的查表操作。矢量量化主要包括三大關(guān)鍵技術(shù),即碼書設(shè)計(jì)算法、碼字搜索算法以及碼字索引分配算法,其中最重要的是碼書設(shè)計(jì)算法,是關(guān)乎整個(gè)矢量量化器設(shè)計(jì)成功與否的關(guān)鍵所在。因此,對碼書設(shè)計(jì)算法的研究成為了各國學(xué)者關(guān)注和研究的熱點(diǎn)。
近年來,神經(jīng)網(wǎng)絡(luò)在圖像處理領(lǐng)域的應(yīng)用取得了很大進(jìn)展,各種學(xué)習(xí)策略相繼提出。Ahal等基于頻域敏感因子的概念,提出了頻域敏感競爭學(xué)習(xí)算法,提高了碼字的利用率。Nartinetz和Choy提出基于‘Neural-Gas’的碼書設(shè)計(jì)算法。等提出了擴(kuò)張競爭學(xué)習(xí)算法。在該算法中,增加了神經(jīng)網(wǎng)絡(luò)權(quán)值矢量之間的排斥因子。
學(xué)習(xí)矢量量化LVQ作為一種簡單的硬判決學(xué)習(xí)算法在學(xué)習(xí)過程中只更新獲勝的神經(jīng)元權(quán)值矢量,并不斷地調(diào)整學(xué)習(xí)率,以使得算法能夠逐漸收斂。然而,LVQ算法對網(wǎng)絡(luò)初始狀態(tài)極為敏感。由于LVQ算法每次只更新獲勝神經(jīng)元的權(quán)值矢量,所以對競爭神經(jīng)網(wǎng)絡(luò)的初始狀態(tài)的依賴性很強(qiáng),容易陷入局部最優(yōu),最終得到的碼書性能也比較差,進(jìn)而影響到重構(gòu)圖像的質(zhì)量。
發(fā)明內(nèi)容
本發(fā)明的目的在于針對上述已有的技術(shù)不足,提出一種用于圖像重構(gòu)的二步學(xué)習(xí)矢量量化碼書生成方法,以減少對初始狀態(tài)的依賴,跳出局部最優(yōu),獲得更優(yōu)的碼書,提高解碼器端重構(gòu)圖像的質(zhì)量。
本發(fā)明的技術(shù)思路是:通過一個(gè)判決函數(shù)判斷是否有被錯(cuò)誤劃分的數(shù)據(jù),然后根據(jù)一定的糾正學(xué)習(xí)策略對競爭神經(jīng)網(wǎng)絡(luò)進(jìn)行調(diào)整。其具體實(shí)現(xiàn)步驟如下:
(1)輸入一幅圖像X,將其劃分為N個(gè)互不重疊、大小為n×n的圖像小塊,并將這些圖像小塊轉(zhuǎn)換為K維訓(xùn)練矢量xk,K=n×n;
(2)初始化一個(gè)具有M個(gè)神經(jīng)元的競爭神經(jīng)網(wǎng)絡(luò),隨機(jī)選擇M個(gè)圖像小塊作為神經(jīng)元的權(quán)值矢量v1,v2,...,vM,M>0;
(3)初始化參數(shù),設(shè)置初始學(xué)習(xí)率α0=0.5、初始去學(xué)習(xí)率η0=0.2、初始補(bǔ)償學(xué)習(xí)率β0=0.01、總迭代次數(shù)T=20×N、初始迭代次數(shù)t=0;
(4)更新學(xué)習(xí)率α(t)=α0(1-t/T),確定并記錄K維訓(xùn)練矢量xk在競爭神經(jīng)網(wǎng)絡(luò)中的輸出oi(xk):
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于西安電子科技大學(xué),未經(jīng)西安電子科技大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210151874.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 根據(jù)用戶學(xué)習(xí)效果動(dòng)態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個(gè)人化學(xué)習(xí)服務(wù)的方法
- 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲介質(zhì)
- 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)移動(dòng)學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲介質(zhì)
- 游戲?qū)W習(xí)效果評測方法及系統(tǒng)





