[發明專利]加權矩陣系數的自適應量化有效
| 申請號: | 202010687098.8 | 申請日: | 2016-03-21 |
| 公開(公告)號: | CN111899746B | 公開(公告)日: | 2022-10-18 |
| 發明(設計)人: | 班基·塞蒂亞萬;艾雅·蘇謨特 | 申請(專利權)人: | 華為技術有限公司 |
| 主分類號: | G10L19/008 | 分類號: | G10L19/008;G10L19/038;G10L19/16;H04N19/126;H04N19/44 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 518129 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 加權 矩陣 系數 自適應 量化 | ||
本發明為加權矩陣系數的自適應量化,涉及一種用于將包括信號幀的輸入信號編碼為量化比特的方法。所述方法包括:針對輸入信號(101)的每個幀生成包括從所述幀獲得的矩陣系數的信號矩陣(103、203、CovM#1,...,CovM#N);將每個信號矩陣的矩陣系數分組成多個分區矢量為每個分區矢量選擇矢量量化方案中的一個矢量量化方案并根據所選擇的矢量量化方案量化所述分區矢量以獲得量化比特(108、208)。在自適應模式下,所述方法包括:對從不同幀獲得的矩陣系數進行不同的分組,和/或為從不同幀獲得的分區矢量選擇不同的矢量量化方案。
本申請為2018年8月15號遞交中國專利局,申請號為201680081847.4,申請名稱為“加權矩陣系數的自適應量化”的中國專利申請的分案,本申請全部內容包含在母案中。
技術領域
本發明大體涉及音頻和/或視頻編碼領域。本發明具體涉及一種用于將包括音頻和/或視頻幀的輸入信號編碼為量化比特的編碼器,用于將量化比特解碼為包括音頻和/或視頻幀的輸出信號的解碼器以及相應的編碼和解碼方法。最后,本發明涉及一種具有用于執行這種方法的程序代碼的計算機程序。
背景技術
在音頻和/或視頻應用中,常見的問題是對大輸入數據進行有效地編碼。例如,已知的音頻應用可以基于涉及6個以上通道(5.1)的編碼方案,而未來的編碼方案預計將采用任意數量的輸入通道,以使甚至更多的通道和更多的輸入數據不得不被處理和編碼。此外,針對22.2個通道,已知使用通道/目標編碼方案,參見2014年12月Herre,J.,Hilpert,J.,Kuntz,A.和Plogsties,J.發表在音頻工程學會雜志的第62卷,第12期,第821–830頁的“MPEG-H音頻-通用空間/3D音頻編碼的新標準”以及支持多達32個通道的球形麥克風。
從這方面來說,要解決的關鍵問題之一是找到一種方法來有效地編碼大量的矩陣系數或元素。這些矩陣系數通常衍生于特定類型的矩陣,如協方差矩陣。例如,在基于Karhunen-Loeve變換(Karhunen-Loeve Transform,簡稱KLT)的音頻編碼方案中清楚地示出了證明,參見2001年7月Yang,D.,Ai,H.,Kyriakakis,C.和Kuo,C.-C.J.發表在SPIE會議錄的數據/圖像編碼,壓縮及加密IV的數學和應用的第4475卷,第43–54頁的“增強多通道音頻編碼的自適應Karhunen-Loeve變換”。該方案要求傳輸至少一個大小為M×M的協方差矩陣,其中M表示輸入通道的數量。如果在頻域中進行編碼,矩陣的數量甚至更重要。而且,如果處理必須以幀為單位進行更新,例如,每20毫秒,則矩陣的數量進一步增加。
在圖像或視頻編碼領域,編碼問題更為明顯。在這種情況下,要被編碼的矩陣可以不是方矩陣,而是非對稱矩形矩陣。要量化的矩陣基本上由從圖像輸入信號獲得的圖像元素組成。圖像編碼中的應用的更多描述的概述被呈現在例如1996年2月Cosman,P.C.,Gray,R.M.和Vetterli,M.發表在IEEE圖像處理匯刊的第5卷,第2號的“概述:圖像子帶的矢量量化”。量化大量矩陣系數的已知方法包括簡單地進行標量量化或一維矢量量化(one-dimensional vector quantization,簡稱1-D VQ)。然而,眾所周知,相應的編碼效率是有限的,并不可觀。編碼大量矩陣系數的其它已知方法使用若干現有技術的矢量量化(vectorquantization,簡稱VQ)方案,例如直接VQ、分裂VQ或增益-形狀VQ。然而,現有技術的主要問題之一是難以選擇適合一組通用輸入信號的特定方案。其他已知的編碼器在應用VQ方案之前嘗試對矩陣本身進行預處理。這種預處理的示例包括通過變換過程對矩陣的對角元素進行歸零。
發明內容
意識到上述提到的缺點和問題,本發明旨在改善現有技術。特別地,本發明的目的是提供用于對包括例如信號幀的輸入信號的編碼/解碼進行改善的編碼器,編碼方法,解碼器和解碼方法。
本發明特別旨在改善大輸入數據的編碼/解碼。本發明還旨在改善對輸入信號和例如對一組通用輸入信號的矢量量化方案的選擇。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華為技術有限公司,未經華為技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010687098.8/2.html,轉載請聲明來源鉆瓜專利網。





