[發明專利]立體聲編碼的方法、裝置無效
| 申請號: | 201310270930.4 | 申請日: | 2010-02-12 |
| 公開(公告)號: | CN103366748A | 公開(公告)日: | 2013-10-23 |
| 發明(設計)人: | 吳文海;苗磊;郎玥;張琦 | 申請(專利權)人: | 華為技術有限公司 |
| 主分類號: | G10L19/008 | 分類號: | G10L19/008;G10L19/06;G10L19/22 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 518129 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 立體聲 編碼 方法 裝置 | ||
技術領域
本發明實施例涉及多媒體領域,尤其涉及一種立體聲處理技術,具體為立體聲編碼的方法、裝置。
背景技術
現有的立體聲編碼方法,有強度立體聲,BCC(Binaual?Cure?Coding)和PS(Parametric-Stereo?coding)編碼方法,通常情況,采用強度編碼需要提取左右聲道間的能量比ILD(InterChannel?Level?Difference)參數,將ILD參數作為邊信息進行編碼,并優先傳送到解碼端以幫助恢復立體聲信號。ILD是個普遍存在并反映聲場信號的信號特性參數,ILD能對聲場能量較好的體現,然而立體聲往往存在背景空間和左右方向的聲場,僅采用傳送ILD恢復還原立體聲的方式已經不能滿足恢復原始立體聲信號的要求,于是提出了傳送更多參數以更好恢復立體聲信號的方案,除了提取最基本的ILD參數外,還提出傳送左右聲道的相位差(IPD:InterChannel?Phase?Difference)及左右聲道的互相關ICC參數,有時也會包含左聲道與下混信號的相位差(OPD)參數,將這些反應立體聲信號背景空間和左右方向聲場信息的參數和ILD參數共同作為邊信息進行編碼并發送到解碼端以還原立體聲信號。
編碼碼率是多媒體信號編碼性能的重要評判因素之一,對低碼率的采用是業界共同追求的目標,現有的立體聲編碼技術在傳送ILD的同時傳送LPD、ICC和OPD參數勢必需要提高編碼碼率,因為LPD、ICC以及OPD參數都是信號的局部特性參數,用于反應立體聲信號的分帶信息,編碼立體聲信號的LPD、ICC以及OPD參數,需要對立體聲信號的每一個分帶編碼LPD、ICC以及OPD參數,對立體聲信號的每一個分帶而言,每個分帶IPD編碼需要多個比特,每個分帶ICC編碼需要多個比特,依此類推,則立體聲編碼參數需要大量的比特數才能增強聲場的信息,在較低碼率要求下則只能增強部分分帶,達不到逼真還原的效果,導致低碼率下恢復出的立體聲信息和原輸入信號之間有較大的差距,從聽覺效果來說,會給收聽者帶來極不舒適的聽覺感受。
發明內容
本發明實施例提供一種立體聲編碼方法、裝置和系統,增強低碼率下聲場信息,提升編碼效率。
本發明實施例提供了一種立體聲編碼的方法,所述方法包括:
變換時域立體聲左聲道信號和右聲道信號到頻域形成頻域上的左聲道信號和右聲道信號;頻域上的左聲道信號和右聲道信號經過下混生成單聲道下混信號,傳送所述下混信號進行編碼量化后的比特;提取頻域上左聲道信號和右聲道信號的空間參數;利用頻域上左右聲道信號估計立體聲左右聲道間的群延時以及群相位;量化編碼所述群延時和群相位以及所述空間參數。
本發明實施例提供了一種估計立體聲信號的方法,所述方法包括:
確定關于頻域立體聲左右聲道信號間的加權的互相關函數;對加權的所述互相關函數進行預處理;根據預處理結果估計得到立體聲左右聲道信號間的群延時以及群相位。
本發明實施例提供了一種估計立體聲信號的裝置,所述裝置包括:
加權互相關單元,用于確定關于頻域立體聲左右聲道信號間的加權的互相關函數;預處理單元,用于對加權的所述互相關函數進行預處理;估計單元,根據預處理結果估計得到立體聲左右聲道信號間的群延時以及群相位。
本發明實施例提供了一種立體聲信號編碼的設備,所述設備包括:
變換裝置,用于變換時域立體聲左聲道信號和右聲道信號到頻域形成頻域上的左聲道信號和右聲道信號;下混裝置,用于頻域上的左聲道信號和右聲道信號經過下混生成單聲道下混信號;參數提取裝置,用于提取頻域上左聲道信號和右聲道信號的空間參數;估計立體聲信號裝置,用于利用頻域上左右聲道信號估計立體聲左右聲道間的群延時以及群相位;編碼裝置,用于量化編碼所述群延時和群相位,所述空間參數和所述單聲道下混信號。
本發明實施例提供了一種立體聲信號編碼的系統,所述系統包括:
如上所述立體聲信號編碼的設備、接收設備以及傳送設備,接收設備用于接收立體聲輸入信號用于立體聲編碼設備;傳送設備52,用于傳送所述立體聲編碼設備51的結果。
因此,通過引入本發明實施例,群延時和群相位被估計并被應用到立體聲編碼中來,使得通過全局的方位信息估計方法在低碼率下能得到更為準確的聲場信息,增強了聲場效果,極大的提升編碼效率。
附圖說明
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華為技術有限公司,未經華為技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310270930.4/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種基于二氧化碳自由基的含氧液體的除氧方法
- 下一篇:一種靜中通衛星天線





